《表3 关键词组提取结果:基于公式描述结构和词嵌入的科技文档检索方法》

《表3 关键词组提取结果:基于公式描述结构和词嵌入的科技文档检索方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于公式描述结构和词嵌入的科技文档检索方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

采用RAKE[19]算法提取文档的关键词组以及它们所占的权重(WordScore)。使用停用词表去除文档中一些常见的高频词汇,例如“a,of,the”等;将抓取的关键词进行还原,例如“distributions”还原为“distribution”;通过设置关键词在文本中出现的次数等提取高频词汇。根据实验需要,每个文档选取10个高频词汇,输出符合条件的词组以及相对应的权重,文档“Folded normal distribution.html”提取关键字部分结果如表3所示。