《表1 主要深度强化学习算法分类》
深度强化学习的主要算法有两种类型:基于值函数的DRL和基于策略梯度的DRL。主要算法如表1所列。
图表编号 | XD00197464000 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.15 |
作者 | 孔松涛、刘池池、史勇、谢义、王堃 |
绘制单位 | 重庆科技学院机械与动力工程学院、重庆科技学院机械与动力工程学院、重庆科技学院机械与动力工程学院、重庆科技学院机械与动力工程学院、重庆科技学院机械与动力工程学院 |
更多格式 | 高清、无水印(增值服务) |
深度强化学习的主要算法有两种类型:基于值函数的DRL和基于策略梯度的DRL。主要算法如表1所列。
图表编号 | XD00197464000 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.15 |
作者 | 孔松涛、刘池池、史勇、谢义、王堃 |
绘制单位 | 重庆科技学院机械与动力工程学院、重庆科技学院机械与动力工程学院、重庆科技学院机械与动力工程学院、重庆科技学院机械与动力工程学院、重庆科技学院机械与动力工程学院 |
更多格式 | 高清、无水印(增值服务) |