《表1:归一化语谱图水平方向像素点数目h与Pd、Ps的对应关系》

《表1:归一化语谱图水平方向像素点数目h与Pd、Ps的对应关系》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于语谱图和深度置信网络的方言自动辨识与说话人识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了研究DBN隐含层的节点数对方言辨识的识别率影响,本文利用归一化处理以后得到的水平方向像素点数目为40、垂直方向像素点数目为176的语谱图进行仿真实验。我们改变每个隐含层的节点数(两个隐含层的节点数相同),并分别记录对应的识别率(如图8所示)。如果隐含层节点数过少,则会影响该网络的分类性能,长沙方言辨识的识别率低。从图8可以看出,当单个隐含层的节点数设置为25时,长沙方言辨识的识别率为91.67%。单个隐含层节点数提高至50以后,深度置信网络的识别率提升至93.33%。再进一步提高单个隐含层节点数,深度置信网络识别率维持在93.33%。值得注意的是,深度置信网络隐含层节点数增加了以后,网络训练过程中参数调整的计算复杂度增加,从而导致收敛速度变慢。因此,综合考虑识别率和网络参数调整的收敛速度两方面因素,每个隐含层节点数设定为50~100之间比较合适。