《表3 评论家网络结构:基于多类型传感数据的自动驾驶深度强化学习方法》

《表3 评论家网络结构:基于多类型传感数据的自动驾驶深度强化学习方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于多类型传感数据的自动驾驶深度强化学习方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了处理多源的传感器信息,设计了如图2所示的不同的特征提取模块。对于车辆与道路边缘的距离信息(即游戏中的track信息),设计一维的卷积层进行特征提取;对于图像信息(即游戏中的img信息),设计二维卷积层进行特征提取,两种类型的信息经过特征提取层后与表1中的速度和角度信号等进行组合,输出给全连接层进行处理。评论家网络则根据演员网络合并后的特征和输出的动作对Q值进行预测,计算损失并迭代更新网络参数。具体的特征提取及后续的演员‐评论家网络结构如表2和表3所示。