《表2 情感分类对比实验Tab.2 Comparative experiments of sentiment classification》
为了评估扩展语义相似情感词、引入词语间的统计特征和采用Adaboost分类模型的方法的整体效果,本实验在酒店、手机评论两个语料上与SCCR方法[14-17]进行对比.SCCR方法对中文在线评论进行情感分类,分类效果较好,可比性较强.实验选择NVAA作为初始特征,使用中文维基百科语料训练Word2vec生成词嵌入,词嵌入维度为200维.对于每一条评论,应用词嵌入计算其他词语与NVAA中每个词语的语义相似度,将相似度大于一定阈值的词语添加进NVAA特征集扩充情感语义特征,阈值的取值范围为0~1,以0.05为间隔循环设置阈值,最终选取使得准确率最高的阈值.把扩充后的特征集作为最终特征集,利用引入词语间统计信息的特征降维方法DF-TF进行特征降维,采用布尔权重,将评论集表示成特征-评论的向量空间模型,最后采用由弱分类器加权集成的Adaboost分类模型进行情感分类.表2为情感分类对比实验.
图表编号 | XD002948100 严禁用于非法目的 |
---|---|
绘制时间 | 2018.11.01 |
作者 | 罗森林、毛焱颖、潘丽敏、陈倩柔、魏超 |
绘制单位 | 北京理工大学信息系统及安全对抗实验中心、北京理工大学信息系统及安全对抗实验中心、北京理工大学信息系统及安全对抗实验中心、北京理工大学信息系统及安全对抗实验中心、北京理工大学信息系统及安全对抗实验中心 |
更多格式 | 高清、无水印(增值服务) |