《表2 DUC2001中对比实验结果》

《表2 DUC2001中对比实验结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融合词和文档嵌入的关键词抽取算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了证明本文算法的有效性,在两个公开数据集Hulth2003和DUC2001上,与目前主流关键词抽取算法进行了对比实验。由于本文算法是一种基于图的无监督方法,因此选取了3个基于图的经典抽取算法Text Rank[12]、Topic Rank[21]、Single Rank[13]。另外,还选取了一个基于统计的经典算法TF-IDF,以及一个基于Embedding思想的Embed Rank算法[29],实验中Text Rank、Single Rank以及本文算法中图的节点均为名词或形容词,Topic Rank的图中节点为主题簇,实验中选择每个簇中最中心的词语作为关键词,本文算法的阻尼系数α取0.2,词共现窗口设置为1,详细的实验结果如表1和表2所示,详细列出了抽取的关键词个数分别为5、10、15时,各算法的抽取结果。