《表1 不同网络层次下Li-GRU和Li-SGRU的性能》

《表1 不同网络层次下Li-GRU和Li-SGRU的性能》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于改进型轻门控循环单元的语音识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了比较Li-GRU和改进的Li-SGRU的模型性能,本文选取TIMIT语料库进行音素序列识别的实验。表1给出在TIMIT数据集中,网络层数为3至5层时,分别采用LiGRU和Li-SGRU的模型性能。从表1中可以发现,对于相同的模型,随着网络层数的增加,其识别效果会得到提高,但网络的参数数量和训练时间也随之增加。不仅如此,在同样的层数下,Li-SGRU的识别效果都略优于Li-GRU,并且随着层数的递增,其在测试集的音素错误率分别下降了4.7%、2.8%、3.6%。图2是网络层数为5层时LiSGRU和Li-GRU在测试集上的音素错误率曲线。从图2中可以发现,当训练周期(epoch)为5时Li-GRU的测试集音素错误率只有58.87%,而Li-SGRU却为34.26%;并且,当训练周期为25时,Li-SGRU已基本收敛,而LiGRU的曲线还呈现下降趋势。由此可见,Li-SGRU拥有更快的收敛速度。以上实验结果验证本文提出的Li-SGRU相对于标准的Li-GRU有更强的竞争力,使用该模型可以提高网络性能,并加快网络收敛。