《表3 四个模型对比:基于深度学习的主题模型研究》
注:l为每个文档的平均长度,|B|≈|D|l(l-1)/2[30].
最后,我们对比四种方法的复杂度、适用场景及其在线推断方法,如表3所示.其中DMM与LDA模型的时间复杂度相接近,且均低于BTM和CTM.CTM时间复杂度最高,这主要是因为CTM需要额外的时间来从超分布中估计超参数{μ,Σ}.BTM的复杂度次之,其复杂度主要取决于从文档集中挖掘出的双词规模.当应用于短文本分类时,由于文档平均长度较短,挖掘出的双词集合规模相对也较小,因而BTM的时间复杂度与LDA差距较小.
图表编号 | XD00163167000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 黄佳佳、李鹏伟、彭敏、谢倩倩、徐超 |
绘制单位 | 南京审计大学信息工程学院、南京审计大学信息工程学院、武汉大学计算机学院、武汉大学计算机学院、南京审计大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |