《表3 Robo Cup3D步行速度对比》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于深度Q网络的仿人机器人步态优化》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

图4代表的是DQN训练中评价函数值Reward的变化曲线图，由图可知Reward的值在将近1000步的训练后趋于一个稳定值，即NAO机器人最终稳定的质心速度。图5展示了在RoboCup3D仿真环境下NAO机器人的步行图。图5上半部分为主视图，中间部分为左视图，从图中可以看出训练后机器人步态非常稳定，没有出现摔倒的情况。而图5下半部分是经过手动调试的步态，身体晃动幅度较大、不稳定。经过多次测试求平均值，经过深度Q网络训练后的仿人机器人的直线步行速度可以达到0.74 m/s，在此速度下各参数值如表2所示。而在其他约束条件不变的情况下，运用标准的粒子群算法对上述参数进行优化，仿人机器人的直线速度只有0.65 m/s[17]。由于粒子群算法在多维参数情况下，很容易过早收敛，形成局部最优，从而验证了本文所提算法的有效性。本文还对2018RoboCup3D中国赛中前八的队伍进行了步行速度测试，如表3所示。从表中可知，经过深度Q网络优化的双足机器人步行速度处于第一集团，具有相当的竞争力。

图表编号	XD0068488600 严禁用于非法目的
绘制时间	2019.04.01
作者	袁雯、刘惠义
绘制单位	河海大学计算机与信息学院、河海大学计算机与信息学院
更多格式	高清、无水印（增值服务）