《表3 贡献预测的文本区域》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于CNN和LSTM的智能文本分类》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在传统的分类方法中，只有文本出现在训练数据中才能对预测做出贡献。作为对比，CNN强有力的一点是即使文本没有出现在训练数据中，只要包含部分的组成成分，也能对预测做出贡献。根据这个观点，表3展示了来自测试集的文本区域，它们没有出现在训练集中，无论是全部还是部分，但是仍然对预测做出了很大的贡献。一个值得注意的模式是像“am entirely satisfied”和“am overall impressed”。这些形容词单独出现可能是含混不清的，如果想知道评论者确实是“satisfied”，需要去看这个序列“am satisfied”，但是在这里面插入一个副词，例如“entirely”是很常见的。“best X ever”是另外一种模式，在这里有鉴别力的词汇对不是毗邻的。类似这样一些模式，在传统分类中，是需要消除歧义的，但是在改进的CNN模型中却完全没有问题。例如，“am X satisfied”和“nonnegative X”，在传统体系中会认为是没有相关性的，从而不能为预测做出贡献，但在改进的CNN体系中却被认为是非常有用的。

图表编号	XD0050405700 严禁用于非法目的
绘制时间	2019.06.01
作者	王星峰
绘制单位	辽东学院信息工程学院
更多格式	高清、无水印（增值服务）