《表7 部分主题对应的主题词及概率》
对乌兹别克斯坦新闻语料进一步清理,得到有效新闻语料8764条。从中随机选择新闻进行多标签标注,共标注新闻语料914条,有效标签58类。基于标注数据训练Labeled LDA模型,得到主题词频率矩阵,选取部分主题对应的频率最大的6个主题词,如表7所示。
图表编号 | XD0056135700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.28 |
作者 | 马明清、袁武、葛全胜、袁文、杨林生、李汉青、李萌 |
绘制单位 | 中国科学院地理科学与资源研究所、中国科学院大学、北京理工大学计算机学院、中国科学院地理科学与资源研究所、中国科学院地理科学与资源研究所、中国科学院地理科学与资源研究所、中国公安部第一研究所、中国科学院地理科学与资源研究所、中国科学院大学 |
更多格式 | 高清、无水印(增值服务) |