《表3 2种迭代方法所得优化结果对比》

《表3 2种迭代方法所得优化结果对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于马尔科夫决策过程的家庭能量管理智能优化策略》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了验证采用不同求解算法计算的多样性,给出了值迭代和q学习这2种迭代方法所求得的最优策略结果,如表3所示。由表3可以看出,2种迭代方法所求得的优化结果相差较小,但各有特点:值迭代方法能够给出偏向于贴合用户用电习惯的、较为稳定的控制方案,更加符合经济型用户的需求;q学习方法能够给出更多变的策略集合,更多地探索动作空间,从而降低了用户的用能费用,更加符合体验型用户的需求。