《表2 Bark尺度和ERB尺度对应的中心频率和临界带宽》
基底膜是耳蜗的重要组织结构,从蜗底到蜗尖的基底膜可感受不同频率的音频。耳蜗可被简单认为是一个空间机械式频率分析器,可使输入信号在基底膜上呈现非线性分布。由此可将基底膜模拟成一个滤波器组,在听觉生理学中,临界频带描述了该“听觉滤波器”的中心频率和带宽。常用的临界频带有Bark尺度和ERB尺度,这两种尺度都能模拟人耳听觉的非线性特性,Bark尺度在掩蔽效应上有很大作用[31],而ERB尺度则更与心理声学模型中的等响度激励模型相关[32],两种尺度对应的中心频率和带宽也不相同。表2是Bark尺度和ERB尺度的频率群表,该频率群的划分是人耳听觉掩蔽效应的物理表现。本实验旨在对比分别使用两种临界频带尺度模拟基底膜非线性特性的性能,以及对腭裂语音高鼻音等级自动识别正确率的影响。分别测试了基于ERB尺度的Gammatone滤波器组(简称ERB滤波器组)[33]和基于Bark尺度的小波包滤波器组[34](简称Bark滤波器组)的识别正确率。使用Bark尺度时,各频段的中心频率是固定的,频带个数由信号采样率决定,而使用ERB尺度时,各频段的中心频率可根据频带个数计算。原始语音信号的采样率为22 050 Hz,信号截止频率为11 025 Hz,对应的1 Bark尺度滤波器共23个。ERB滤波器组同样使用23个滤波器。两种滤波器对应的中心频率(fic)和临界带宽(Biw)如表2所示。
图表编号 | XD0053255800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.15 |
作者 | 付方玲、何飞、付佳、尹恒、黄华、何凌 |
绘制单位 | 四川大学电气信息学院、四川大学电气信息学院、四川大学电气信息学院、四川大学华西口腔医院、四川大学电气信息学院、四川大学电气信息学院 |
更多格式 | 高清、无水印(增值服务) |