《表7 直接分词和使用术语库的分词准确率对比》
为了提高中文分词质量,本文使用生成的医学术语库作为用户词典,用于辅助分词,表7给出了直接分词和使用术语库进行辅助分词的结果对比.在实验中,本文将测试数据集分为三个子集,分别从彩超、胃镜、支气管镜三个主要的样本数据来比较分词的准确率.由表7可知,使用提取出的医学术语库可以明显提高中文分词的质量,平均准确率达到了97.78%,相比直接进行分词,提高了7.23%,并且在胃镜检查的文本类簇中的分词效果最好,准确率达到98.24%,而在支气管镜的文本类簇中的分词效果提升最明显,准确率提高了9.30%,由此可见,使用关键词提取得到的术语库进行辅助分词确实有效地提高了医学文本数据的分词质量.
图表编号 | XD0079879000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.01 |
作者 | 杨兵、聂铁铮、申德荣、寇月、于戈 |
绘制单位 | 东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、东北大学计算机科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |