《表2 主要机构发文情况:一种融合主题特征的自适应知识表示方法》
Trans E等基于翻译的模型往往把关系看作简单的实值向量,忽略了关系上丰富的文本信息,因而难以处理复杂关系。LDA主题模型是一种非监督模型,能够用来识别大规模文本集中隐含的主题信息,被广泛应用于文本分类和自动摘要等文本分析任务中[22]。基于此,本文考虑利用LDA主题模型抽取关系描述文本中潜在的主题特征,并基于主题特征构建关系向量。LDA训练后会生成两个分布,即文本-主题概率分布θ和主题-词概率分布φ,如表1和表2所示。表1反映每个文本在各个主题上的分布概率,表2则反映每个词在各个主题中的权重。如果直接将关系描述文本d对应的主题概率分布θd作为关系向量,此时θd中主题的个数必须与表示向量的维数相同,且θd中每一维的值(主题出现的概率)都为正,势必影响知识表示的灵活性和可推理性。
图表编号 | XD00197523100 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.15 |
作者 | 陈文杰 |
绘制单位 | 中国科学院成都文献情报中心 |
更多格式 | 高清、无水印(增值服务) |