《表9 探索到所有可解状态时的耗时》

《表9 探索到所有可解状态时的耗时》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种面向自动驾驶推理任务的工作流调度策略》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

SA-RL算法运行5次探索到所有可解状态数时的耗时如表9所示.从表中可以看出当探索到所有可解状态时,Q-learning、Sarsa较Sarsa (λ)、Q (λ)而言耗时较短,原因是Sarsa(λ)、Q (λ)算法进行学习时不仅要对遍历过状态的状态-动作表进行更新,还要对效用迹矩阵进行更新,随着状态空间的增大,算法所要更新的表空间不断增加,因此耗时较长.