《表1 LDA主题模型符号解释》
LDA(Latent Dirichlet Allocation)是一种无监督的,可抽取文本特征的概率增长模型.LDA不需要事先对模型进行训练,可以通过无监督的学习方法来挖掘出文本中隐含的语义信息,将其应用到专利文本中时,不需要手动对文档添加标签,只需要给出期望生成的主题数K和主题中的TopN关键词N即可[14].LDA是一种“主题-文档-词汇”的三层贝叶斯模型,把主题视为词汇出现的概率分布,而文档认为是主题出现的概率分布,而构成主题的每一个词汇又都是无序的,那么就降低了文档的维度,大大简化了问题的复杂度[15].LDA主题模型如图3所示,模型的符号解释如表1所示.
图表编号 | XD00105122200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 艾楚涵、姜迪、吴建德 |
绘制单位 | 昆明理工大学知识产权发展研究院、昆明理工大学计算中心、昆明理工大学民航与航空学院 |
更多格式 | 高清、无水印(增值服务) |