《表2 女性说话人的纯净语音EMDAMDF、LSAMDF和PF-mAMDFs的检测结果》

《表2 女性说话人的纯净语音EMDAMDF、LSAMDF和PF-mAMDFs的检测结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于多项式拟合的AMDF基音检测改进算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

表1、表2分别给出了男性说话人和女性说话人在无噪声环境下的各个算法的实验结果,标出了各个样本拥有最低和次低的%GPE的算法,可以看到对于男性说话人(M1—M2—M3—M4—M5),当多项式阶次m=3时,即PF3AMDF拥有最低(或次低)的%GPE;对于女性说话人(F1—F2—F3—F4—F5),当多项式阶次m=5时,即PF5AMDF拥有最低的%GPE。而且笔者注意到,相比EMDAMDF和LSAMDF,PFmAMDF(男性说话人m=3,女性说话人m=5)的检测性有了一定的提升。同时,分别统计了Keele库中10个样本的平均基音(以采样点计算),同时计算了一帧语音信号中含有多少个基音长度,具体结果如表3、表4所示。以M1为例,可以看到M1中一般的浊音帧包含2到3个基音周期长度,对应表1可以看到PF2AMDF和PF3AMDF拥有最低和次低的%GPE。因此,笔者认为PFmAMDF的阶次m与待检测语音信号包含基音周期的格式N存在正比关系,即m∝N,其中N=Lframe/Lpitch,Lframe为语音帧帧长,Lpitch为基音周期长度。为了进一步验证文中的想法,在接下来的实验中,对样本加入不同信噪比的高斯白噪声之后再次进行实验。表5、表6给出了噪声环境下信噪比SNR为10dB,5dB,0dB,-5dB,-10dB时,分别统计所有男性说话人样本和所有女性说话人样本的实验结果,可以看到,与无噪声环境下的结果相同,对于男性说话人,PF3AMDF仍然拥有最低的%GPE;而对于女性说话人,PF5AMDF拥有最低的%GPE。这时,与EMDAMDF和LSAMDF相比,PFmAMDF有了非常大的提升。