《表1 N-gram与语言学模板方法抽取的实验效果对比》
为了了解语言学模板对术语抽取的影响,我们针对采用语言学模板和不采用语言学模板(N-gram方法)进行了对比实验。其中,统计关键词集中词性模板的频率(如一元名词术语模板的频率为0.0613)并进行排序,其中频率大于0.001的词性模板共计108个。N-gram方法抽取的词长限制为1-6,为了避免输出集合存在大量噪声词汇,过滤了仅出现在一篇文章中的词以及在语料库中仅出现一次的词。表1统计了两种方法的准确率、召回率及F1值,结果表明采用语言学模板进行候选术语抽取有效地提高了候选术语抽取的准确率。因此,为了缩短后续处理的时间,统计术语抽取在语言学模板抽取的候选术语的基础上进行。
图表编号 | XD00213463500 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.26 |
作者 | 蒋婷 |
绘制单位 | 南京财经大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |