《表3 样本数量为300和500时不同抽样方法建立的机器学习模型精度与最优模型精度比较》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《抽样方法与样本数量对建筑能耗机器学习模型精度的影响研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

根据以上分析，由于Sobol序列抽样产生样本对于样本空间具有较好的代表性，所以Sobol序列的得到的机器学习模型相比于其他方法得到的模型，其精度有较好的稳定性。本文选择样本数量为1 000时得到的最佳模型精度作为目标值，与样本数量相对较小时的模型进行精度对比，以准确研究4种抽样方法得到模型的精度。通过式（1）计算制冷与采暖能耗模型的偏差。y为模型在样本数量为1 000时的最优精度，yi为不同样本数量i及不同抽样方法下得到模型的精度。表3为4种抽样方法所得模型与抽样1 000次后4种方法中最优模型精度的比较，样本数量分别为300和500。由表3可知，在4种抽样方法中，Sobol序列得到模型精度与最优模型精度的偏差最小。这说明Sobol序列抽样所取得模型在较少样本下精度依然较高，因此Sobol序列抽样可以取得计算时间与模型精度的平衡，不仅可减少建模时间，而且可得到精确的机器学习模型。

图表编号	XD00164554900 严禁用于非法目的
绘制时间	2020.04.01
作者	朱传琪、田玮、史佳鑫、尹宝泉
绘制单位	天津科技大学机械工程学院、天津科技大学机械工程学院、天津科技大学机械工程学院、天津市建筑设计院
更多格式	高清、无水印（增值服务）