《表3 评论家网络结构:基于多类型传感数据的自动驾驶深度强化学习方法》
为了处理多源的传感器信息,设计了如图2所示的不同的特征提取模块。对于车辆与道路边缘的距离信息(即游戏中的track信息),设计一维的卷积层进行特征提取;对于图像信息(即游戏中的img信息),设计二维卷积层进行特征提取,两种类型的信息经过特征提取层后与表1中的速度和角度信号等进行组合,输出给全连接层进行处理。评论家网络则根据演员网络合并后的特征和输出的动作对Q值进行预测,计算损失并迭代更新网络参数。具体的特征提取及后续的演员‐评论家网络结构如表2和表3所示。
图表编号 | XD0067053700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.01 |
作者 | 杨顺、蒋渊德、吴坚、刘海贞 |
绘制单位 | 吉林大学汽车仿真与控制国家重点实验室、吉林大学汽车仿真与控制国家重点实验室、吉林大学汽车仿真与控制国家重点实验室、吉林大学汽车仿真与控制国家重点实验室 |
更多格式 | 高清、无水印(增值服务) |