《表3:动态原型神经网络小样本抽取实验结果》
在原始PN中,使用取均值的方法选择原型点。这种方法是静态的、固定的。这种方法可能会丢失句子层次上的一些信息,降低整个模型的性能。所以将取均值法看做是一种静态的特殊注意机制。据此,我们将均值选择推广到一个真实的注意机制。我们实验了自注意力和查询注意力两种注意力机制。这些动态选择方法比原始PN方法获得了更好的结果。进一步的分析表明,这种性能的提升并不是由神经网络决定的,而是由注意力机制决定的。我们的注意力机制是均值的延伸,它可以动态准确地选择原型,考虑更多的语义信息,进而提高准确性。将注意机制作为均值的推广,是一种动态选择原型的新策略。这是一种进行更精确的原型选择的新方法。
图表编号 | XD00149585200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.10 |
作者 | 张华平、吴林芳、张芯铭、商建云、李昌赫 |
绘制单位 | 北京理工大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |