《表2 候选词基础特征统计结果》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《学术文本词汇功能识别——在关键词自动抽取中的应用》
本研究对实验使用的8286篇文献的候选词的词频特征和位置特征进行了统计,结果如表2所示。其中,正例的TFIDF均值为0.088,约为负例的2倍,正例的FI均值为0.280,远小于负例均值0.430。可以看出,相较于非关键词,关键词在摘要中出现的位置更靠前,并且具有更大的TFIDF值,因此,对于更有潜力成为关键词的词——具有“研究问题”和“研究方法”功能的候选词,本研究将通过一定的加权策略增大其TFIDF,并减小其FI,从而增强基础特征在关键词抽取中的作用。
图表编号 | XD00206683200 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.24 |
作者 | 姜艺、黄永、夏义堃、李鹏程、陆伟 |
绘制单位 | 武汉大学信息管理学院、武汉大学信息检索与知识挖掘研究所、武汉大学信息管理学院、武汉大学信息检索与知识挖掘研究所、武汉大学信息资源研究中心、武汉大学信息管理学院、武汉大学信息检索与知识挖掘研究所、武汉大学信息管理学院、武汉大学信息检索与知识挖掘研究所 |
更多格式 | 高清、无水印(增值服务) |