《表1 数据集介绍：EntropyRank：基于主题熵的关键短语提取算法》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《EntropyRank：基于主题熵的关键短语提取算法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

500N-KPCrowd[23]数据集包括500篇新闻文档，每个类别包含50篇新闻，关键短语由亚马逊工作人员所标注；Inspec数据集[7]包括2 000篇科学论文摘要，其中关键短语由作者和读者分别标注；DUC[24]数据集包括308篇新闻标题及新闻文档，其中关键短语由作者和读者分别标注；NUS[25]数据集包括211篇会议论文，且每篇论文长度在4至12页之间，其中关键短语由作者和读者分别标注；Krapivin[26]数据集包括2 304篇科技论文，其中关键短语由作者和读者分别标注；KP20K[27]数据集包括200篇科技论文摘要及其标题，其中关键短语由作者和读者分别标注。经过Mihalcea和Tarau[13]中的描述分析，对Inspec数据集我们采用读者标注的作为文档的标注关键短语，其他数据集均采用作者标注的作为文档的标注关键短语。对数据集的详细描述，如表1所示。

图表编号	XD00109149500 严禁用于非法目的
绘制时间	2019.11.01
作者	尹红、陈雁、李平
绘制单位	西南石油大学计算机科学学院智能与网络化系统研究中心、西南石油大学计算机科学学院智能与网络化系统研究中心、西南石油大学计算机科学学院智能与网络化系统研究中心
更多格式	高清、无水印（增值服务）