《表3 主题最高代表词相关的前10个词》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Skip-Gram结构和词嵌入特性的文本主题建模》
图4、图5描述了主题嵌入和主题词嵌入的向量点积值,最高主题词和其它主题词的向量点积.由图4可见主题和词的相关性成下降趋势,而图5最高主题代表词和其它词之间相关性有些波动,但总体也成下降趋势.表3列出了与每个主题最高代表词点积最大的前10个词,从相关词结果可见,表2和表3词之间的重合度较高,也存在一些词不重合,体现了图5的小幅波动性特点.上述实验结果体现了性质2、性质3所分析的结论,当主题向量和主题最高代表词向量相似时,主题向量和词向量间的点积选择出的主题词,可近似表示为主题最高代表词和其它主题词之间的相关性.这也说明向量的相似性虽然在减小,但是主题最高代表词与部分主题代表词间的pmi值还是较大.
图表编号 | XD00175974200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.01 |
作者 | 夏家莉、曹中华、彭文忠、张守胜 |
绘制单位 | 江西财经大学信息管理学院财政大数据中心、江西财经大学信息管理学院财政大数据中心、江西师范大学软件学院、江西财经大学信息管理学院财政大数据中心、江西财经大学信息管理学院财政大数据中心 |
更多格式 | 高清、无水印(增值服务) |