《表2 候选词基础特征统计结果》

《表2 候选词基础特征统计结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《学术文本词汇功能识别——在关键词自动抽取中的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本研究对实验使用的8286篇文献的候选词的词频特征和位置特征进行了统计,结果如表2所示。其中,正例的TFIDF均值为0.088,约为负例的2倍,正例的FI均值为0.280,远小于负例均值0.430。可以看出,相较于非关键词,关键词在摘要中出现的位置更靠前,并且具有更大的TFIDF值,因此,对于更有潜力成为关键词的词——具有“研究问题”和“研究方法”功能的候选词,本研究将通过一定的加权策略增大其TFIDF,并减小其FI,从而增强基础特征在关键词抽取中的作用。