《表1 动作值表:基于深度强化学习的图像修复算法设计》
当且仅当两者相等时有最大的回报。由于智能体将一直在环境中进行修改图像的探索,所以二者之间总有差值,最后会在最优解上下波动,得到最优策略。动作值见表1所列。
图表编号 | XD0077837600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.20 |
作者 | 崔小洛、栾晓飞 |
绘制单位 | 威海海洋职业学院信息工程系、威海海洋职业学院信息工程系 |
更多格式 | 高清、无水印(增值服务) |
当且仅当两者相等时有最大的回报。由于智能体将一直在环境中进行修改图像的探索,所以二者之间总有差值,最后会在最优解上下波动,得到最优策略。动作值见表1所列。
图表编号 | XD0077837600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.20 |
作者 | 崔小洛、栾晓飞 |
绘制单位 | 威海海洋职业学院信息工程系、威海海洋职业学院信息工程系 |
更多格式 | 高清、无水印(增值服务) |