《表2 年运行费用对比:强化学习算法在空调系统运行优化中的应用研究》

《表2 年运行费用对比:强化学习算法在空调系统运行优化中的应用研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《强化学习算法在空调系统运行优化中的应用研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

接下来关注从运行费用角度定量评价强化学习控制器的运行效果。为了更好地与基准策略作对比,量化强化学习控制器的控制效果,本案例定义了Score指标。计算方法如式(8)所示,式中cost代表不同运行策略下的供热季累积运行费用,Score的值越接近1,则意味着强化学习控制策略越接近最优控制策略。图5为Score指标随运行天数的变化,表2为不同运行策略下年运行费用的对比情况,可以看出在运行初期,强化学习控制器缺乏“运行经验”,运行费用甚至高于使用固定温度控制策略的运行费用。随着强化学习控制器不断探索,“运行经验”的增加,Score值逐步变大,截止第一个供热季结束,Score值为0.55,与固定温度控制策略的运行费用相比降低了8.3%。在第二个供热季,强化学习控制器进入运行阶段,完全利用已有“运行经验”做决策,经计算,第二个供热季结束时,Score值为0.73,与固定温度控制策略的运行费用相比降低了10.8%。