《表1 词语的向量化表示》

《表1 词语的向量化表示》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度学习的95598重大服务事件识别研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为避免传统文本表示的弊端,本文采用word2vec[4]方法将词语表示成具有相同指定维度的向量,如:[0.792,–0.177,–0.107,0.109,–0.542,...]。经此表示后,每个词语即成为空间中的一个点,点间距离亦可作为衡量词语间距离的度量。具体地,以经过预处理后的95598语音转写文本数据为语料库,基于python的gensim包训练得到词语的向量化表示,如表1所示。其中,每一行代表一个词语,每一列代表该词语在此方向上的值。