《表2 仿真参数设置:使用同心多环阵提升声源定位鲁棒性》
本小节,为了验证UCCA具有更优的定位鲁棒性,该文评估了不同信噪比和混响条件下的DOA估计的统计性能。评估算法均采用CH域的CSSM方法。声源语料来自于TIMIT[28]语料库。UCA半径和阵元数分别设置为60 mm和16个,UCCA配置参数如表1所示,其他的仿真参数设置如表2所示。UCA的最高CH展开阶数为7阶,UCCA的CH展开阶数受限于阵元数最少的环,最高为3阶。在接下来的性能评估实验中,麦克风阵列被放置于距离地面1 m高的房间水平面中心位置,单个播放声源的扬声器被依次放置于方位角间隔30?的6个方位,扬声器高度同为1 m,声源到麦克风阵列中心位置距离为2 m。以下仿真结果会统计平均所有声源方位。虚源法[29]被用于生成带有混响的多通道信号,多通道不相关的高斯白噪声被添加至带混响信号,加入噪声后的信号被看作是阵列采样信号。另外,需要使用语音激活检测(Voice activity detection,VAD)模块[30]对阵列采样信号进行预处理,截取语音段,舍去非语音段。语音段数据每10帧(0.16 s)获得一个平均的声源方位估计结果。每一帧数据选取离散傅里叶变换后的88个子带(500~6000 Hz),考虑频域步进间隔为5个子带,此时每一帧数据会进行16次声源方位估计。那么10帧一共获得160个定位结果,对该160个结果进行中值平均进而估计出一个较为稳健的声源方位。仿真分析中使用的软件为Matlab 2018b,处理器为Intel Core i7-6700HQ,主频2.6 GHz,处理器的核心数为4。
图表编号 | XD00113566700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 张国昌、吴鸣、韩欣宇、武帅兵、殷兰、杨军 |
绘制单位 | 中国科学院大学、中国科学院噪声与振动重点实验室声学研究所、中国科学院大学、中国科学院噪声与振动重点实验室声学研究所、中国科学院大学、中国科学院噪声与振动重点实验室声学研究所、中国科学院噪声与振动重点实验室声学研究所、北京信息科技大学自动化学院、中国科学院大学、中国科学院噪声与振动重点实验室声学研究所 |
更多格式 | 高清、无水印(增值服务) |