《表1 N-gram与语言学模板方法抽取的实验效果对比》

《表1 N-gram与语言学模板方法抽取的实验效果对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《学术文献术语抽取方案比较研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了了解语言学模板对术语抽取的影响,我们针对采用语言学模板和不采用语言学模板(N-gram方法)进行了对比实验。其中,统计关键词集中词性模板的频率(如一元名词术语模板的频率为0.0613)并进行排序,其中频率大于0.001的词性模板共计108个。N-gram方法抽取的词长限制为1-6,为了避免输出集合存在大量噪声词汇,过滤了仅出现在一篇文章中的词以及在语料库中仅出现一次的词。表1统计了两种方法的准确率、召回率及F1值,结果表明采用语言学模板进行候选术语抽取有效地提高了候选术语抽取的准确率。因此,为了缩短后续处理的时间,统计术语抽取在语言学模板抽取的候选术语的基础上进行。