《表2 电子病历手术实体标准化实验结果》
表2中,Siamese-LSTM表示编码器部分使用单向的LSTM网络,LSTM单元数量为20。Siamese-BiLSTM表示编码器使用双向LSTM,每个方向有10个LSTM单元,共20个。编辑距离算法的top-5正确率比top-1正确率高了约14.5个百分点,差距较大。通过分析编辑距离算法出错的样本,发现与手术名在字面上相似的标准术语有多个,匹配时易造成干扰,比如“左肺上叶切除术”对应标准术语是“肺叶切除术”,但对“余肺肺叶切除术”造成了干扰,使得编辑距离算法无法作出正确匹配。两种Siamese网络在top-1、top-5正确率上都明显好于编辑距离,可见对于手术实体标准化,仅依靠字面形式上的相似度,融合语义信息和序列信息的向量空间模型能有效消除干扰项影响,提升标准化正确率。对于Siamese网络编码器部分,双向LSTM在top-1、top-5正确率上均明显好于单向LSTM,尤其是在最重要的top-1正确率上提升了约11.6个百分点,说明手术实体标准化任务仅有单向序列信息是不够的,增加逆向序列信息能有效改善手术实体标准化效果。
图表编号 | XD0073034600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.15 |
作者 | 赵逸凡、郑建立、徐霄玲 |
绘制单位 | 上海理工大学医疗器械与食品学院、上海理工大学医疗器械与食品学院、上海理工大学医疗器械与食品学院 |
更多格式 | 高清、无水印(增值服务) |