《表2 智能体Agent的动作空间》
控制车速和换道可看成是强化学习问题[22],在IDM和MOBIL模型基础上提出一种深度学习与Q学习相结合的深度Q-网络[23]DQN智能体来学习Q函数,根据已知的周围车辆的状态和可用的道路信息,智能体在其动作空间选择最佳的换道、加速和减速的动作,智能体的动作空间定义如表2.
图表编号 | XD0083860900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 沈宇、王晓、韩双双、陈龙、王飞跃 |
绘制单位 | 中国科学院自动化研究所复杂系统管理与控制国家重点实验室、中国科学院大学、青岛慧拓智能机器有限公司、中国科学院自动化研究所复杂系统管理与控制国家重点实验室、青岛智能产业技术研究院、中国科学院自动化研究所复杂系统管理与控制国家重点实验室、青岛慧拓智能机器有限公司、青岛智能产业技术研究院、青岛慧拓智能机器有限公司、中山大学数据科学与计算机学院无人系统研究所、中国科学院自动化研究所复杂系统管理与控制国家重点实验室 |
更多格式 | 高清、无水印(增值服务) |