《表3 样本数量为300和500时不同抽样方法建立的机器学习模型精度与最优模型精度比较》

《表3 样本数量为300和500时不同抽样方法建立的机器学习模型精度与最优模型精度比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《抽样方法与样本数量对建筑能耗机器学习模型精度的影响研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

根据以上分析,由于Sobol序列抽样产生样本对于样本空间具有较好的代表性,所以Sobol序列的得到的机器学习模型相比于其他方法得到的模型,其精度有较好的稳定性。本文选择样本数量为1 000时得到的最佳模型精度作为目标值,与样本数量相对较小时的模型进行精度对比,以准确研究4种抽样方法得到模型的精度。通过式(1)计算制冷与采暖能耗模型的偏差。y为模型在样本数量为1 000时的最优精度,yi为不同样本数量i及不同抽样方法下得到模型的精度。表3为4种抽样方法所得模型与抽样1 000次后4种方法中最优模型精度的比较,样本数量分别为300和500。由表3可知,在4种抽样方法中,Sobol序列得到模型精度与最优模型精度的偏差最小。这说明Sobol序列抽样所取得模型在较少样本下精度依然较高,因此Sobol序列抽样可以取得计算时间与模型精度的平衡,不仅可减少建模时间,而且可得到精确的机器学习模型。