《表3 词语特征与取值:基于文本情感特征的心理评估模型》
文本情感特征提取是将表达文本情感倾向性的文本特征表示成计算机可识别处理的特征向量.为了提取文本情感特征,首先要将文本符号进行数值化,文本中词语的情感极性和词性很大程度决定了整个文本的情感倾向,因此考虑使用词语的情感极性和词性来构建情感词向量.本文将词语表示成一个k维向量,其中k表示词语的特征个数,特征值为0或n,0表示该词语不具有该特征,n表示该词语在该特征下的情感极性值.词语特征与取值列于表3.情感词向量生成过程如下:首先,利用分词工具对文本数据进行分词和词性标注.在分词过程中,用jieba.load_userdict()函数加载上述划分得到的基础情感字典,得到以词语为单位的文本字符串.然后,根据词语的情感极性和词性将每个词语映射到一个特征向量中得到文本特征矩阵.
图表编号 | XD0067042400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.26 |
作者 | 杜天宝、于纯浩、温卓、孔馨 |
绘制单位 | 吉林大学软件学院、吉林大学计算机科学与技术学院、吉林大学新能源与环境学院、吉林大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |