《表6 本文模型与I2B2评测结果F值对比》
由表4可知,CRF模型在原子特征的基础上加入组合特征后,性能有所提高,因为组合特征包含了更多的上下文信息,能为模型的正确输出提供更多支持,因此本文深层条件随机场模型在检测隐私实体边界时,采用了原子特征和组合特征,深层条件随机场模型比传统的机器学习模型如SVM、HM M等的精确率和召回率都有所提高,整体F值得到提高.BR-BiRNN模型基于循环神经网络,不需要额外的专业领域知识,可以自动提取特征.BR-BiLSTM-CRF模型结合了神经网络层和条件随机场层,F值在三个语料上分别达到93.02%、92.51%和88.62%.妇产科医疗文本是中文语料集,由于中文预处理需要分词,存在一定的分词误差,其F值低于I2B2评测任务英文语料集结果.I2B2评测数据集是公开数据集,本文提出的三种深层网络模型与评测任务提交结果对比如表6所示.
图表编号 | XD0045010300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.01 |
作者 | 李慧林、柴玉梅、孙穆祯 |
绘制单位 | 郑州大学信息工程学院、郑州大学信息工程学院、华中科技大学公共管理学院 |
更多格式 | 高清、无水印(增值服务) |