《表5 治疗方法与预后:基于注意力网络的语体多元特征挖掘》
为了进一步分析小说、新闻及课本的关键词,使用T分布随机近邻嵌入(t-distributed stochastic neighbor embedding,t-SNE)降维算法将所提取关键词的向量映射到二维平面内表示,并选择每一个簇中注意力分值最高的词作为该簇的语义主题词,如表5所示。表5中,小说的主题词主要是主人公的名字(柳生、余占鳌)及地点名词(高密、东北)为主;新闻主要是事件主题名(股市、经济、市场等)及核心人物(主席)等;课本的主题词是人名(高尔基、列宁)、小说选篇的主人公名字(孔乙己、闰土)、议论文的主题词(爱国)等。
图表编号 | XD00197673300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.10 |
作者 | 吴海燕、刘颖 |
绘制单位 | 清华大学人文学院、清华大学人文学院 |
更多格式 | 高清、无水印(增值服务) |