《表1 网络参数的设定值：基于神经网络的强化学习在服务机器人导航中的研究》

《表1 网络参数的设定值：基于神经网络的强化学习在服务机器人导航中的研究》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于神经网络的强化学习在服务机器人导航中的研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在学习的初始阶段，Q值是随机设定的，为了探索到所有的动作，采用ε-Greedy探索策略选取动作，以1-ε的概率选择最大Q值对应的动作，以ε的概率随机选择任一动作，随着学习的不断进行，逐渐降低ε的大小。网络中各个参数的设定值如表1所示。

图表编号	XD00174763100 严禁用于非法目的
绘制时间	2020.04.25
作者	陈双、李龙、罗海南
绘制单位	芜湖哈特机器人产业技术研究院有限公司、芜湖哈特机器人产业技术研究院有限公司、芜湖哈特机器人产业技术研究院有限公司
更多格式	高清、无水印（增值服务）

查看“表1 网络参数的设定值：基于神经网络的强化学习在服务机器人导航中的研究”的人还看了

: 表3 CNN识别结果：基于机器学习与卷积神经网络的放电声音识别研究

: 表3 运行损耗对比：强化学习在双足机器人步态控制中的应用

: 表4 模型参数设定：基于卷积神经网络的物流服务业顾客满意度评价方法研究

: 表1：基于自监督学习的卷积神经网络在CT图像中的肝脏自动分割研究

: 表1 服务器性能参数：深度强化学习在物联网边缘计算中的应用研究

: 表1 电机参数：基于神经网络算法的电感参数辨识在弱磁控制中的研究

《表2 人为干扰时系统响应情况记

《表1 Tegra X2配置及性能》