《表3 不同模型的参数量比较》
![《表3 不同模型的参数量比较》](http://bookimg.mtoou.info/tubiao/gif/XDTQ202010015_08000.gif)
本系列图表出处文件名:随高清版一同展现
《基于双向长效注意力特征表达的少样本文本分类模型研究》
为了分析模型的复杂度,本文探究了BLAN模型和Induction-Network-Routing模型的参数量,如表3所示。可知,Induction-Network-Routing模型的整体参数量为1.986×109,BLAN模型的参数量为2.269×109。这是由于BLAN模型为了捕获更具有鉴别性的特征,引入了注意力特征表达模块,该模块进行了多次线性变换,从而导致参数量的增加。而与Induction-Network-Routing模型中的Bi LSTM模块相比,Bi-TCN的参数量很小,因此,BLAN模型整体的参数量和Induction-Network-Routing模型的参数量相差不大。此外,上述两个模型的Loss随迭代步数的变化如图6所示。BLAN模型的Loss曲线在训练步数迭代到约2 500时开始收敛,相较于Induction-Network-Routing模型,BLAN模型的收敛速度有较大的提升。
图表编号 | XD00227031900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.25 |
作者 | 徐彤彤、孙华志、马春梅、姜丽芬、刘逸琛 |
绘制单位 | 天津师范大学计算机与信息工程学院、天津师范大学计算机与信息工程学院、天津师范大学计算机与信息工程学院、天津师范大学计算机与信息工程学院、天津师范大学计算机与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |