《表6 同步检测器的SLR特征的识别正确率》
%
听觉模型作为前端处理器,依次模拟了外中耳、基底膜、毛细胞和神经纤维的功能和机制,从多个并行通道上提取出听觉内部表达。听觉内部表达中包含着声激励的各种信息,正常语音和腭裂语音的频谱结构由于共振峰的差异而不尽相同,使用同步检测器和侧抑制网络等后处理都能从听觉内部表达中提取出听觉谱特征。这两种后处理的输入都是听觉神经纤维活动的时频域模式,两者都能锐化共振峰边缘,使谱结构轮廓更加明显,并提高频谱分辨率。侧抑制是一种非线性的神经抑制现象,侧抑制网络模拟相邻频段间的相互抑制和竞争关系,其每个通道的特征参数都会受到相邻通道的影响,其输出与相邻通道形成抑制连接[40];而同步检测器可加强共振峰结构和检测信号周期性[26],其特征参数只与当前通道有关,计算的是该通道的输入信号与其延时信号的比值。本小节实验对比了同步检测器和侧抑制网络提取的谱特征参数的识别正确率。使用相同的听觉模型、SVM分类器,其中基底膜模型使用54个基于ERB尺度的Gammatone滤波器。由表6可得,同步检测器提取的谱特征SLR作为特征参数进行高鼻音等级识别的正确率为91.27%;由表7可得,侧抑制网络提取的谱特征LIN作为特征参数的识别正确率为82.58%。
图表编号 | XD0053255400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.15 |
作者 | 付方玲、何飞、付佳、尹恒、黄华、何凌 |
绘制单位 | 四川大学电气信息学院、四川大学电气信息学院、四川大学电气信息学院、四川大学华西口腔医院、四川大学电气信息学院、四川大学电气信息学院 |
更多格式 | 高清、无水印(增值服务) |