《表8 LDA与Labeled LDA模型精度》
本文选取部分乌兹别克斯坦新闻数据进行人工标注,生成验证数据集,以对LDA与Labeled LDA的挖掘精度进行对比。由于2种模型主题类别差异较大,因此需针对2种模型分别进行数据标注。基于验证数据,分别统计LDA模型与Labeled LDA模型正确推断出主题的次数,计算其精度(表8)。可以发现,Labeled LDA比LDA在精度上有较大的提升,类别也更为精细,表明通过添加人工标注信息,能够显著提高主题模型挖掘效果。
图表编号 | XD0056136300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.28 |
作者 | 马明清、袁武、葛全胜、袁文、杨林生、李汉青、李萌 |
绘制单位 | 中国科学院地理科学与资源研究所、中国科学院大学、北京理工大学计算机学院、中国科学院地理科学与资源研究所、中国科学院地理科学与资源研究所、中国科学院地理科学与资源研究所、中国公安部第一研究所、中国科学院地理科学与资源研究所、中国科学院大学 |
更多格式 | 高清、无水印(增值服务) |