《表5 特征变量相关性:基于机器学习模型的专利质量预测初探》

《表5 特征变量相关性:基于机器学习模型的专利质量预测初探》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习模型的专利质量预测初探》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

第二,线性相关问题。计量模型中,最小二乘回归法会选择一条唯一的回归线,满足数据集的整体残差平方和达到最小值。越来越多的模型被不断加入自变量参数。而自变量之间的线性相关会导致模型参数估计得不稳定或不易解释[27]。如表5所示,本文所采用的专利特征变量之间,如引证专利数量(nBWD)和引证专利的其他特征之间存在明显的线性相关。对此,机器学习模型的正则化思想能够解决自变量相关问题,即在参数估计的目标优化方程中加入涉及模型复杂度的惩罚项,避免预测模型的过度拟合,并且提高模型预测的准确度。