《表3种特征抽取方法的Top0特征词对比》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于改进TF-IDF-CHI算法的农业科技文献文本特征抽取》
注:粗斜体字为明显不符合“番茄遗传育种”主题
首先本文用于实验的文本语料仅限于中文,尚未证明加权改进方法对英文等语种文献是否同样有效;其次,本文的文本分类任务是二元分类,尽管目前需要对科技文献进行二元分类的应用场合依然很多,但要满足需求的多元化,需要继续进一步优化方法及实现,以便适应多元分类需求,拓展ImpTF-IDF-CHI方法的应用范围;最后,词语在文档中位置不同,对文本特征的贡献度是不一样的,这也是需要在今后对该项技术进一步修改时要考虑的。
图表编号 | XD00106585100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.25 |
作者 | 杜若鹏、鲜国建、寇远涛 |
绘制单位 | 中国农业科学院农业信息研究所、农业农村部农业大数据重点实验室、中国农业科学院农业信息研究所、农业农村部农业大数据重点实验室、中国农业科学院农业信息研究所、农业农村部农业大数据重点实验室 |
更多格式 | 高清、无水印(增值服务) |