《表2 T=100,APNews部分主题词》

《表2 T=100,APNews部分主题词》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Skip-Gram结构和词嵌入特性的文本主题建模》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验打印出了APNews数据集在T=100时,使用SPPMI模型词向量的8个主题代表词,结果如表2所示.由主题代表词可以理解该主题所表示的语义信息,例如:Topic1表示航空飞行、Topic2表示艺术展览、Topic3表示总统选举等.这些主题的主题向量和主题代表词的输入向量和输出向量之间的余弦值如图2、图3所示.由结果可见:每个主题向量和该主题的最高代表词的输入向量余弦值在0.7左右,它们间的相似性较高;且主题向量和词的输入向量余弦值普遍大于主题向量和词的输出向量余弦值,这体现了主题分布假设,主题向量类似于中心词的输入向量;主题嵌入向量与后面主题代表词向量的余弦值则基本上呈下降趋势,说明它们的向量相似性减弱.