《表3 RemoveRank与其他方法的比较》
为保证算法的有效性,使用6种方法在默认参数下分别抽取3-10个关键词,评测不同的算法使用本文数据集在准确率、召回率和F值的表现,结果如图3和表3所示。本文基于图结构特性的Remove Rank算法在准确率、召回率和F值各项指标都略优于TextRank以及TF-IDF算法,其中在TopK=5时,在F值指标上RemoveRank相比于TextRank增量提升了6%。在抽取关键词数量为4-7时,RemoveRank算法相比于TextRank算法提升的较多,这是因为根据RemoveRank算法的策略,通过移除节点的方式进行关键词抽取,对于抽取较少数量(1-3个)的关键词,去除节点的数量比较少,无法对整个词图网络造成较大影响,因此效果仅比原始TextRank算法略好,而在去除较多节点后,各个语义块的子关键词已经被移除较多,因此会导致效果也趋近于TextRank算法。
图表编号 | XD009073300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.25 |
作者 | 王安、顾益军、李坤明、李文政 |
绘制单位 | 中国人民公安大学信息技术与网络安全学院、中国人民公安大学信息技术与网络安全学院、中国人民公安大学信息技术与网络安全学院、中国人民公安大学信息技术与网络安全学院 |
更多格式 | 高清、无水印(增值服务) |