《表7 直接分词和使用术语库的分词准确率对比》

《表7 直接分词和使用术语库的分词准确率对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种面向医学文本数据的结构化信息抽取方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了提高中文分词质量,本文使用生成的医学术语库作为用户词典,用于辅助分词,表7给出了直接分词和使用术语库进行辅助分词的结果对比.在实验中,本文将测试数据集分为三个子集,分别从彩超、胃镜、支气管镜三个主要的样本数据来比较分词的准确率.由表7可知,使用提取出的医学术语库可以明显提高中文分词的质量,平均准确率达到了97.78%,相比直接进行分词,提高了7.23%,并且在胃镜检查的文本类簇中的分词效果最好,准确率达到98.24%,而在支气管镜的文本类簇中的分词效果提升最明显,准确率提高了9.30%,由此可见,使用关键词提取得到的术语库进行辅助分词确实有效地提高了医学文本数据的分词质量.