《表5 嵌入层改进评估:基于深度强化学习的机场出租车司机决策方法》

《表5 嵌入层改进评估:基于深度强化学习的机场出租车司机决策方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度强化学习的机场出租车司机决策方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

嵌入层表示是利用神经网络去学习原始输入的合理表示,这种合理的表示等价于对输入进行合理的预处理,从而使得网络训练更加稳定。因此,为了评估嵌入层的效果,本文使用一个不带嵌入层的DQN作为对比,在大型城市机场远郊的环境中分别多次训练2种网络,计算2种网络输出Q值的标准差,实验结果如表5所示。