《表7 子文档集主题–语词概率分布》
利用Python编写程序对社群文档集合W进行BTM模型训练,构建社群话题主题模型。根据公式(2)计算文档集wi不同主题数K的困惑度,如表6所示,可以看出不同主题模型的K值越大,困惑度越低,但困惑度只在0.001级别内进行波动,并无较为显著的差异,因此设置主题数K=1,根据公式(1)在经过1000次的迭代之后得到每一子文档集下的主题–语词概率分布,如表7所示。
图表编号 | XD00112710300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.25 |
作者 | 蒋武轩、熊回香、叶佳鑫、安宁 |
绘制单位 | 华中师范大学信息管理学院、华中师范大学信息管理学院、华中师范大学信息管理学院、武汉大学信息管理学院 |
更多格式 | 高清、无水印(增值服务) |