《表4 主题词Tab.4 Topic words》
为了查看主题词的质量,在新浪博客数据集的实验中选取5个主题进行显示,每个主题选择了概率最大的前10个单词,如表4所示。通过观察,可以得知主题分别与电信、金融、体育、电商和美食有关,每一个主题代表着一个类别,且主题之间的交叉性较小。由此可见,本文采用的方法获得了一定的效果。
图表编号 | XD0024039600 严禁用于非法目的 |
---|---|
绘制时间 | 2018.11.01 |
作者 | 张青、韩立新、勾智楠 |
绘制单位 | 河海大学计算机与信息学院、河海大学计算机与信息学院、河海大学计算机与信息学院 |
更多格式 | 高清、无水印(增值服务) |