《表1 二次函数的优化实验结果》
loss*final为目标函数在各算法下收敛后的大小.即我们用收敛后的目标函数大小与优化器(DDPG算法)得到的目标函数大小相比,若其比优化器得到的损失值更小,则相对误差为负,表示其性能比优化器要更优,反之说明表现不如训练好的优化器.在二次函数上各算法的优化结果如表1所示,可以看到在保证相对误差非常小的情况下,强化学习算法花费了更少的步数.
图表编号 | XD0043853700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.05 |
作者 | 唐长成、叶佐昌 |
绘制单位 | 清华大学微电子所、清华大学微电子所 |
更多格式 | 高清、无水印(增值服务) |