《表2 水泥物理性能:基于LightGBM的高校就业预测模型》
本文以某高校2015至2018届毕业生相关就业信息作为数据集,数据集存在严重的非平衡。数据集预处理过程:(1)首先采集教务处、招生就业处的学生信息,例如姓名、专业、学习成绩和就业单位等。(2)清洗掉数据中的敏感、私密特征(身份证号、家庭住址等)。(3)对标签特征进行独热编码(One-Hot Encoding),对连续性特征进行归一化处理,并删除重复缺失数据,最终得到11542条、13个特征、4类的有效数据。数据集描述如表2和表3所示:
图表编号 | XD00192514700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.10 |
作者 | 罗丹、刘旋 |
绘制单位 | 信阳农林学院信息工程学院、信阳农林学院信息工程学院 |
更多格式 | 高清、无水印(增值服务) |