《表1 最优策略下动作价值》

《表1 最优策略下动作价值》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《随机状态下基于期望经验回放的Q学习算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

根据Bellman最优方程,得到最优策略下对应于各状态动作价值如表1.