《表3 贡献预测的文本区域》
在传统的分类方法中,只有文本出现在训练数据中才能对预测做出贡献。作为对比,CNN强有力的一点是即使文本没有出现在训练数据中,只要包含部分的组成成分,也能对预测做出贡献。根据这个观点,表3展示了来自测试集的文本区域,它们没有出现在训练集中,无论是全部还是部分,但是仍然对预测做出了很大的贡献。一个值得注意的模式是像“am entirely satisfied”和“am overall impressed”。这些形容词单独出现可能是含混不清的,如果想知道评论者确实是“satisfied”,需要去看这个序列“am satisfied”,但是在这里面插入一个副词,例如“entirely”是很常见的。“best X ever”是另外一种模式,在这里有鉴别力的词汇对不是毗邻的。类似这样一些模式,在传统分类中,是需要消除歧义的,但是在改进的CNN模型中却完全没有问题。例如,“am X satisfied”和“nonnegative X”,在传统体系中会认为是没有相关性的,从而不能为预测做出贡献,但在改进的CNN体系中却被认为是非常有用的。
图表编号 | XD0050405700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 王星峰 |
绘制单位 | 辽东学院信息工程学院 |
更多格式 | 高清、无水印(增值服务) |