《表3 病史抽取结果示例Table 3 Data extraction results of medical history》
在解决了标注可能存在的问题之后,本研究通过自动规则发现以及人工核对结合的方式,确定了共8条糖尿病史抽取规则,并针对我们采用的信息抽取处理语言Perl,对这些规则进行重写后形成实现信息抽取的正则表达式。例如,病史描述片段“既往史:‘糖尿病’史13年,未给予治疗未监测血糖,5年前患脑梗塞,3年前再发,未遗留后遗症”,应用模版“DM*DT*TIMEUNIT”的对应正则表达式“[糖尿病史(.*?)(年|月|日|天) ]”。部分抽取结果示例见表3。
图表编号 | XD005720800 严禁用于非法目的 |
---|---|
绘制时间 | 2018.04.18 |
作者 | 包小源、黄婉晶、张凯、金梦、李岩、牛承志 |
绘制单位 | 北京大学医学信息学中心、国家医疗服务数据中心、北京大学数学科学学院、北京大学基础医学院、北京大学医学信息学中心、国家医疗服务数据中心、国家医疗服务数据中心、北京大学医学部医院管理处、郑州大学第一附属医院信息处 |
更多格式 | 高清、无水印(增值服务) |