《表3 解决高方差与高偏差的主要方法》

《表3 解决高方差与高偏差的主要方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数值预测的数据处理与模型评估方法综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

模型的误差来源于模型偏差,模型方差与无法避免的误差这三方面。对数值预测问题的假设不正确,比如将非线性回归问题假设为线性回归问题来建模,这种错误的假设会导致模型出现偏差。欠拟合的模型通常会导致模型高偏差,过拟合的模型会导致模型高方差。如果数据出现微小的扰动,预测的结果会出现极大的偏移,这样的模型为高方差模型。高方差模型究其原因是因为模型太过复杂,例如高阶多项式回归模型。机器学习算法中的非参数学习算法都是高方差算法,因为不对数据进行假设,很容易造成过拟合。而参数学习都是高偏差算法,因为预先对数据进行了假设,例如线性回归模型。机器学习中的调参方法就是在模型偏差与方差之间做平衡取舍。大多数机器学习算法容易产生过拟合,而机器学习主要任务也就是在降低模型的高方差。关于解决高方差与高偏差的主要方法如下表3: