《表1 数据清洗:NLP在中医医案症状信息自动化抽取中的应用研究》
数据清理主要通过填写缺失值、光滑噪声数据、识别或删除离群点并解决格式的不一致性,达到格式标准化、清除异常与重复数据、纠正错误的目的[12]。因此,为提高医案信息抽取的准确性,本研究对原始数据中存在的前后词语不一致问题进行预处理,处理结果如表1所示。
图表编号 | XD00207310900 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.15 |
作者 | 屈丹丹、杨涛、胡孔法 |
绘制单位 | 南京中医药大学人工智能与信息技术学院、南京中医药大学人工智能与信息技术学院、南京中医药大学人工智能与信息技术学院 |
更多格式 | 高清、无水印(增值服务) |