《表3 3种算法的学习结果》

《表3 3种算法的学习结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于增量式RBF网络的Q学习算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了充分展示IRBFN-QL算法的有效性,本文在图5(a)所示的仿真环境中,对DQN算法、基于KRLS的IRBFN-QL算法(也即,L2正则化约束加权系数λ=0)、以及基于L2KRLS的IRBFN-QL算法(在本文实验中取λ=0.01)分别进行10次行为学习实验,若运行次数大于1万步仍未完成学习,则判定学习失败;若在1万步前完成学习任务,但在测试阶段发生碰撞,则同样判定学习失败.表3显示了3种算法的最终学习结果.