《表1 主题映射结构表:融合主题模型的在线可比度计算研究》
本文采用两个独立的Online LDA,分别针对近似平行语料库中的英文新闻语料和翻译得到的中文新闻语料进行训练。训练结束后,参考文献[6]中的方法,用词对齐软件GIZA++进行主题映射。该方法的基本思想是如果训练语料主题相同,LDA训练结束后可以确定各个文档的主题分布,如果把主题看作词,则可以认为训练语料是以主题为词的平行语料,通过GIZA++就可以得到主题之间的翻译关系,即主题之间的映射表,其结构如表1所示。
图表编号 | XD0078927900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.25 |
作者 | 赵永标、张其林、谷琼 |
绘制单位 | 湖北文理学院计算机工程学院、湖北文理学院计算机工程学院、湖北文理学院计算机工程学院 |
更多格式 | 高清、无水印(增值服务) |