《表3 不同模型的参数量比较》

《表3 不同模型的参数量比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于双向长效注意力特征表达的少样本文本分类模型研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了分析模型的复杂度,本文探究了BLAN模型和Induction-Network-Routing模型的参数量,如表3所示。可知,Induction-Network-Routing模型的整体参数量为1.986×109,BLAN模型的参数量为2.269×109。这是由于BLAN模型为了捕获更具有鉴别性的特征,引入了注意力特征表达模块,该模块进行了多次线性变换,从而导致参数量的增加。而与Induction-Network-Routing模型中的Bi LSTM模块相比,Bi-TCN的参数量很小,因此,BLAN模型整体的参数量和Induction-Network-Routing模型的参数量相差不大。此外,上述两个模型的Loss随迭代步数的变化如图6所示。BLAN模型的Loss曲线在训练步数迭代到约2 500时开始收敛,相较于Induction-Network-Routing模型,BLAN模型的收敛速度有较大的提升。