《表3 关键词组提取结果:基于公式描述结构和词嵌入的科技文档检索方法》
采用RAKE[19]算法提取文档的关键词组以及它们所占的权重(WordScore)。使用停用词表去除文档中一些常见的高频词汇,例如“a,of,the”等;将抓取的关键词进行还原,例如“distributions”还原为“distribution”;通过设置关键词在文本中出现的次数等提取高频词汇。根据实验需要,每个文档选取10个高频词汇,输出符合条件的词组以及相对应的权重,文档“Folded normal distribution.html”提取关键字部分结果如表3所示。
图表编号 | XD00139939900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.25 |
作者 | 宰新宇、田学东 |
绘制单位 | 河北大学网络空间安全与计算机学院、河北大学网络空间安全与计算机学院 |
更多格式 | 高清、无水印(增值服务) |