《表1 数据集介绍:EntropyRank:基于主题熵的关键短语提取算法》

《表1 数据集介绍:EntropyRank:基于主题熵的关键短语提取算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《EntropyRank:基于主题熵的关键短语提取算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

500N-KPCrowd[23]数据集包括500篇新闻文档,每个类别包含50篇新闻,关键短语由亚马逊工作人员所标注;Inspec数据集[7]包括2 000篇科学论文摘要,其中关键短语由作者和读者分别标注;DUC[24]数据集包括308篇新闻标题及新闻文档,其中关键短语由作者和读者分别标注;NUS[25]数据集包括211篇会议论文,且每篇论文长度在4至12页之间,其中关键短语由作者和读者分别标注;Krapivin[26]数据集包括2 304篇科技论文,其中关键短语由作者和读者分别标注;KP20K[27]数据集包括200篇科技论文摘要及其标题,其中关键短语由作者和读者分别标注。经过Mihalcea和Tarau[13]中的描述分析,对Inspec数据集我们采用读者标注的作为文档的标注关键短语,其他数据集均采用作者标注的作为文档的标注关键短语。对数据集的详细描述,如表1所示。