《表2 T=100,APNews部分主题词》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Skip-Gram结构和词嵌入特性的文本主题建模》
实验打印出了APNews数据集在T=100时,使用SPPMI模型词向量的8个主题代表词,结果如表2所示.由主题代表词可以理解该主题所表示的语义信息,例如:Topic1表示航空飞行、Topic2表示艺术展览、Topic3表示总统选举等.这些主题的主题向量和主题代表词的输入向量和输出向量之间的余弦值如图2、图3所示.由结果可见:每个主题向量和该主题的最高代表词的输入向量余弦值在0.7左右,它们间的相似性较高;且主题向量和词的输入向量余弦值普遍大于主题向量和词的输出向量余弦值,这体现了主题分布假设,主题向量类似于中心词的输入向量;主题嵌入向量与后面主题代表词向量的余弦值则基本上呈下降趋势,说明它们的向量相似性减弱.
图表编号 | XD00175974300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.01 |
作者 | 夏家莉、曹中华、彭文忠、张守胜 |
绘制单位 | 江西财经大学信息管理学院财政大数据中心、江西财经大学信息管理学院财政大数据中心、江西师范大学软件学院、江西财经大学信息管理学院财政大数据中心、江西财经大学信息管理学院财政大数据中心 |
更多格式 | 高清、无水印(增值服务) |