《表1 LDA模型中数学符号的解释》
LDA (Latent Dirichlet Allocation)主题模型是Blei在狄利克雷过程的基础上提出的一种概率生成模型[15]。LDA主题模型也是一种词袋模型,同时它也是一种非监督的机器学习技术,在进行训练时不需要对训练集进行人工标注。该模型认为每篇文档包含多个不同的主题,这些主题以一定概率进行混合形成一篇文档,而每个主题又包含多个不同的词,这些词以一定概率进行混合形成主题。由此,形成了服从Dirichlet分布的文档的主题分布和主题的词分布。LDA主题模型生成一篇文档的过程如图1所示,在文档生成过程中的变量和参数如表1所示。
图表编号 | XD00220658100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.30 |
作者 | 张学民、赵明宇 |
绘制单位 | 河北工业大学经济管理学院、河北工业大学经济管理学院 |
更多格式 | 高清、无水印(增值服务) |