《表4 话题描述效果:基于均衡段落和分话题向量的新闻热点话题检测研究》
话题描述方法的结果如表4所示。第一列为人工定义的各话题标签,第二列为每一个话题自动生成两个或三个短语作为对各话题的描述,设定一定数量是为了降低单个短语错误的影响,数量不等是因为在自动生成过程中进行短语去重处理。由表4可以看到,自动生成的话题描述短语较为接近人工话题描述,在一定程度上满足了话题描述代表性和可读性的要求,如“翟天临学历事件”对应的短语“翟天临事件再度发酵”、“学术不端须改革”,满足了代表该类新闻事件主题的要求,同时具有较好的可读性。
图表编号 | XD00227029700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.25 |
作者 | 魏家泽、董诚、何彦青、刘志辉、彭柯芸 |
绘制单位 | 中国科学技术信息研究所、中国科学技术信息研究所、中国科学技术信息研究所、中国科学技术信息研究所、甘孜藏族自治州科学技术信息研究所 |
更多格式 | 高清、无水印(增值服务) |