《表1 输入特征表:基于机器学习的冠心病住院费用预测研究》
数据预处理后,需要选取更加精确、有意义的特征作为模型训练的特征向量。经查阅相关文献并结合医院数据库的有效信息,本文选取的特征见表1。在回归建模中,分类特征不应直接使用,需要进行独热编码[8]使其特征得以数字化。离散型特征独热编码后,能使得特征向量之间的距离计算更加合理。本文中“护理名称、疾病种类、医保代码、科室名称”特征都属于离散特征,应对其进行相应的独热编码。
图表编号 | XD00102836300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 夏涛、徐辉煌、郑建立 |
绘制单位 | 上海理工大学医疗器械与食品学院、上海理工大学医疗器械与食品学院、上海理工大学医疗器械与食品学院 |
更多格式 | 高清、无水印(增值服务) |