《表1 初筛模型变量:基于数据挖掘算法的慢病住院费用预测模型分析》

《表1 初筛模型变量:基于数据挖掘算法的慢病住院费用预测模型分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据挖掘算法的慢病住院费用预测模型分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

基于以上形成的基础表,通过文献查阅,与业务部门沟通后,确定模型的因变量是二分类的日均住院费用,并筛选出32个与住院费用可能相关的自变量(已去除全为空的变量),参保人静态属性包括性别(X1)、年龄(X2)[6]。参保人动态属性主要包括费用结构(药品费、治疗费、检查费、手术费等)[7-8]、报销结构(统筹基金报销、大病互助报销、现金支付等),以及来访方式[9]。其中,门特的费用结构(药品费、治疗费、检查费、手术费等)(X12~X16) 、报销结构情况(统筹基金报销、大病互助报销、现金支付等)(X3~X11) 、门特来访方式(X31)等变量间接反映了参保人在门特的治疗和给药情况,以及参保人病情。同理,住院的费用结构(药品费、治疗费、检查费、手术费等)(X26~X30) 、报销结构情况(统筹基金报销、大病互助报销、现金支付等)(X17~X25) 、住院方式(X32)等变量则间接反映了参保人住院期间的治疗和给药情况,以及参保人的病情。初筛模型变量见表1。针对初筛的连续型变量进行重新分档,自变量分档的公认标准见表2,分档的规则见表3。