《表5 嵌入层改进评估:基于深度强化学习的机场出租车司机决策方法》
嵌入层表示是利用神经网络去学习原始输入的合理表示,这种合理的表示等价于对输入进行合理的预处理,从而使得网络训练更加稳定。因此,为了评估嵌入层的效果,本文使用一个不带嵌入层的DQN作为对比,在大型城市机场远郊的环境中分别多次训练2种网络,计算2种网络输出Q值的标准差,实验结果如表5所示。
图表编号 | XD00150810800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.01 |
作者 | 王鹏勇、陈龚涛、赵江烁 |
绘制单位 | 中国矿业大学数学学院、中国矿业大学数学学院、中国矿业大学数学学院 |
更多格式 | 高清、无水印(增值服务) |