《表2 选择的变量及其系数》

《表2 选择的变量及其系数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《不平衡数据的关键因素筛选方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:每个变量有5个水平,1、2、3、4、5分别表示不同的水平,数字大小代表症状的严重程度;表中系数为正代表更倾向于判断为发生肝郁脾虚,为负则相反。

实际数据中除了类间不平衡问题,还存在类内不平衡问题,即在某一个类别内,不同子集的数目相差很大。本研究仅仅考虑了类间不平衡问题,未来的工作重点可以放到类内不平衡问题上。在未来的应用及研究中,如果使用了Lasso的方法,最好将Lasso的参数选择和模型的选择放在一起考虑,同时调节参数才能得到真正最优的结果,否则只能得到某个参数条件下的局部最优结果。实际上,不仅仅是Lasso,涉及到两个及以上的参数调节的问题,都需要从全局最优的角度考虑。