《表4 不同模型中句子单词的注意力权重值Tab.4 Attention weight values for sentence words in different models》
为了进一步分析位置注意力机制和类别注意力机制对模型属性情感分类效果的影响,本文从Restaurant领域数据集中抽取了一个样本,将模型LSTM-MATT-AC分别同模型LSTM-NP-AC和LSTM-NC-AC生成的单词注意力权重值进行比较,更深层次地分析不同注意力机制对模型情感分类结果的影响[22]。表4展示了不同模型中句子单词的注意力权重的分配结果。对于属性“service”来说,一方面未添加位置注意力机制的模型LSTM-NP-AC同时赋予了情感词“Great”和“dreadful”较大的权重,而模型LSTM-MATT-AC能够准确识别正确的情感词“dreadful”,并将其权重值从0.460 6提高到0.869 1。这说明加入位置注意力机制的模型能够学习到单词与属性之间相对位置的特征信息,有效地捕获句子中不同单词对属性的影响程度,增强模型的内容注意力层识别正确情感词的能力,从而通过更加合理的权重分配来生成更准确的属性情感特征信息。另一方面由于Restaurant领域数据集的积极情感类别的句子数量约是消极情感类别数量的2.4倍,存在情感类别数量不均衡的现象。对于例句中情感极性属于消极的属性“service”,从表4中可以看出模型LSTM-NC-AC对其所在子句“but the service was dreadful!”中各单词的权重值分配较平均,且分配给该子句的总权重值0.5169远低于模型LSTM-MATT-AC分配给子句的总权重值0.9969,这说明训练数据类别不均衡的模型会存在偏置问题。从注意力权重分配的角度分析,可以发现模型会因某个类别数据量的不足而无法深层次地挖掘该类别数据中隐含的特征信息,从而降低对该类别子句的关注度,赋予较低的权重值,且易造成权值平均化的结果。通过深层次地分析句子中单词的注意力权重,能够有力地论证本文模型采用的位置注意力机制和类别注意力机制在属性情感分析任务中的有效性。
图表编号 | XD0035547700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.10 |
作者 | 支淑婷、李晓戈、王京博、王鹏华 |
绘制单位 | 西安邮电大学计算机学院、陕西省网络数据分析与智能处理重点实验室(西安邮电大学)、西安邮电大学计算机学院、陕西省网络数据分析与智能处理重点实验室(西安邮电大学)、北京小米智能科技有限公司人工智能与云平台、西安邮电大学计算机学院、陕西省网络数据分析与智能处理重点实验室(西安邮电大学) |
更多格式 | 高清、无水印(增值服务) |