《表1 不同主题数目K下的模型得分 (步长为5)》
实验从K=5开始计算,起初采用步长为5对文本进行LDA主题抽取,如表1所示。发现了得分在逐渐递减之后,再适当考虑K更大时的情况,避免得到局部最大值的误差结果,如表2所示。确定了最大值出现的范围后再以步长为1细化分析,得出准确的最佳主题数目,出于对数字直观性的考虑,表中对重叠度均取其倒数,即可理解为区分度,区分度与完整度的乘积为该主题数目下的得分。
图表编号 | XD0090162800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.15 |
作者 | 柏志安、曾剑平 |
绘制单位 | 上海交通大学医学院附属瑞金医院计算机中心、复旦大学计算机科学技术学院 |
更多格式 | 高清、无水印(增值服务) |