《表3 贡献预测的文本区域》

《表3 贡献预测的文本区域》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于CNN和LSTM的智能文本分类》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在传统的分类方法中,只有文本出现在训练数据中才能对预测做出贡献。作为对比,CNN强有力的一点是即使文本没有出现在训练数据中,只要包含部分的组成成分,也能对预测做出贡献。根据这个观点,表3展示了来自测试集的文本区域,它们没有出现在训练集中,无论是全部还是部分,但是仍然对预测做出了很大的贡献。一个值得注意的模式是像“am entirely satisfied”和“am overall impressed”。这些形容词单独出现可能是含混不清的,如果想知道评论者确实是“satisfied”,需要去看这个序列“am satisfied”,但是在这里面插入一个副词,例如“entirely”是很常见的。“best X ever”是另外一种模式,在这里有鉴别力的词汇对不是毗邻的。类似这样一些模式,在传统分类中,是需要消除歧义的,但是在改进的CNN模型中却完全没有问题。例如,“am X satisfied”和“nonnegative X”,在传统体系中会认为是没有相关性的,从而不能为预测做出贡献,但在改进的CNN体系中却被认为是非常有用的。