《表1 CGRU网络参数表》
本文提出的CGRU网络结构如图2(a)所示,网络参数细节如表1所示.CGRU网络改进了前期研究[6]CNN网络结构(图2(c))中的卷积模块,采用3×3的小卷积核,在保证足够感受野的前提下,减少了网络参数,并且在卷积过程中加入batch normalization层,以提升训练速度和模型精度.并且在卷积模块之后加入GRU网络层捕获音频信号的时序变化,使得网络的特征提取能力显著提升.在实验阶段,本文也实现了文献[9]中的RAW CLDNN(图2(b))方法,与之相比本文提出的MFE输入特征经过音频信号预处理更加适用于复杂环境,而原始波形作为输入易受环境影响,泛华能力相对较弱.并且,使用GRU网络层代替LSTM,可以缩减训练时间,降低训练难度,更适用于工程应用.
图表编号 | XD00153664200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.28 |
作者 | 郭东岳、林毅、杨波 |
绘制单位 | 四川大学视觉合成图形图像技术国防重点学科实验室、四川大学视觉合成图形图像技术国防重点学科实验室、四川大学视觉合成图形图像技术国防重点学科实验室、四川大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |