《表1 学习速度比较:基于Q学习算法的综合能源系统韧性提升方法》

《表1 学习速度比较:基于Q学习算法的综合能源系统韧性提升方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Q学习算法的综合能源系统韧性提升方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了验证所提算法的优越性,在同样进行1 000 000次学习的情况下,对比了ε-greedy算法和UCB算法在常规初始化方法和本文所提初始化方法下的学习速度,结果如表1所示。相比于常规初始化方法,本文所提初始化方法在采用ε-greedy算法和UCB算法时的计算效率分别提高了11.9%和14.7%。在常规初始化方法和本文所提初始化方法下,UCB算法所花费时间比ε-greedy算法分别减少了8.25%和11.17%。由此可见,本文采用的基于UCB算法的Q学习算法和提出的初始化方法都能够减少学习时间,提高收敛效率。