《表1 LDA模型中的符号含义》

《表1 LDA模型中的符号含义》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《LDA模型在红酒数据关系挖掘中的应用研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

图1中,D是训练数据集中的文章总数;N是文章中词的总数;K为主题总数;β是主题上的词分布;θ是文章的主题分布,表示文档中每个隐含主题所占的比重,是一个K维变量;z是每次生成文档词w时被选择的主题,由于存在一篇文档中含有多个主题的情况,图中的灰色圆圈部分表示w是一个可观测变量,重复进行N次选择词w及其相关主题z的步骤;α和η是两个超参数,作为Dirichlet分布的先验因子,α表示每篇文档的潜在隐含主题在文档中的Dirichlet分布,η表示潜在隐含主题在每篇文档的关键词中的Dirichlet分布。LDA模型的符号含义如表1所示。