《表5 消歧实体“迈克尔·乔丹”的主题词对分布》

《表5 消歧实体“迈克尔·乔丹”的主题词对分布》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于双词主题模型的半监督实体消歧方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

如表5所示,篮球明星“迈克尔·乔丹”和加州大学教授“迈克尔·乔丹”的主题分布具有较大的差异,但在Top5中某一个主题词对中的两个词有着密切的联系,共同刻画了待消歧实体的主题特征,同时词对中第一个词(命名实体,在表中用加粗表示)表示与待消歧实体频繁共现的命名实体,辅助性表明了消歧实体的真实身份.同时也可以看出,与e LDA相比,使用词对〈实体词,单词〉较好的保持了文本的主题词汇表达内容,减小了e LDA主题模型中的主题漂移现象,具有较好的鲁棒性,例如:在e LDA中,迈克尔·乔丹(篮球明星)Top10〈词汇〉中的〈美国〉,〈纽约〉和迈克尔·乔丹(加州大学教授)中的〈美国〉,〈大神〉等词分别表达迈克尔·乔丹为篮球运动员和大学教授的主题并未有太大关联;而在EBTM中,每个词对都能较为准确的刻画命名实体的相应主题.