《表1 最优策略下动作价值》
根据Bellman最优方程,得到最优策略下对应于各状态动作价值如表1.
图表编号 | XD00139180800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.30 |
作者 | 张峰、钱辉、董春茹、花强 |
绘制单位 | 河北省机器学习与计算智能重点实验室河北大学数学与信息科学学院、河北省机器学习与计算智能重点实验室河北大学数学与信息科学学院、河北省机器学习与计算智能重点实验室河北大学数学与信息科学学院、河北省机器学习与计算智能重点实验室河北大学数学与信息科学学院 |
更多格式 | 高清、无水印(增值服务) |