《表2 测试结果:基于主题提取模型的交通违法行为文本数据的挖掘》
Gensim推荐使用Coherence Model用于对主题模型进行评价,该模型评价主题一致性度测量值常用指标有4个:u_mass、c_v、c_uci、c_npmi,这里选用u_mass,因其运行效率高,测试结果如表2所示。在选择25个主题时,u_mass出现极小值,所以聚类出的合理主题约为25个,符合评估条件。
图表编号 | XD0057386800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.06 |
作者 | 曾祥坤、张俊辉、石拓、邵可佳 |
绘制单位 | 北京警察学院、北京交通大学综合交通运输大数据应用技术交通运输行业重点实验室、北京市公安局公安交通管理局、北京警察学院、马上消费金融股份有限公司 |
更多格式 | 高清、无水印(增值服务) |