《表2 选择的变量及其系数》
注:每个变量有5个水平,1、2、3、4、5分别表示不同的水平,数字大小代表症状的严重程度;表中系数为正代表更倾向于判断为发生肝郁脾虚,为负则相反。
实际数据中除了类间不平衡问题,还存在类内不平衡问题,即在某一个类别内,不同子集的数目相差很大。本研究仅仅考虑了类间不平衡问题,未来的工作重点可以放到类内不平衡问题上。在未来的应用及研究中,如果使用了Lasso的方法,最好将Lasso的参数选择和模型的选择放在一起考虑,同时调节参数才能得到真正最优的结果,否则只能得到某个参数条件下的局部最优结果。实际上,不仅仅是Lasso,涉及到两个及以上的参数调节的问题,都需要从全局最优的角度考虑。
图表编号 | XD0093396800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.03.20 |
作者 | 贾萍萍、李扬 |
绘制单位 | 中国人民大学应用统计科学研究中心、中国人民大学统计学院、中国人民大学应用统计科学研究中心、中国人民大学统计学院 |
更多格式 | 高清、无水印(增值服务) |