《表1 学习速度比较:基于Q学习算法的综合能源系统韧性提升方法》
为了验证所提算法的优越性,在同样进行1 000 000次学习的情况下,对比了ε-greedy算法和UCB算法在常规初始化方法和本文所提初始化方法下的学习速度,结果如表1所示。相比于常规初始化方法,本文所提初始化方法在采用ε-greedy算法和UCB算法时的计算效率分别提高了11.9%和14.7%。在常规初始化方法和本文所提初始化方法下,UCB算法所花费时间比ε-greedy算法分别减少了8.25%和11.17%。由此可见,本文采用的基于UCB算法的Q学习算法和提出的初始化方法都能够减少学习时间,提高收敛效率。
图表编号 | XD00130436000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.10 |
作者 | 吴熙、唐子逸、徐青山、周亦洲 |
绘制单位 | 东南大学电气工程学院、东南大学电气工程学院、东南大学电气工程学院、河海大学能源与电气学院 |
更多格式 | 高清、无水印(增值服务) |