《表1 声音样本集:优化正交匹配追踪和短时谱估计用于声音识别》

《表1 声音样本集:优化正交匹配追踪和短时谱估计用于声音识别》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《优化正交匹配追踪和短时谱估计用于声音识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验采用的40类声音均来自Freesound[20]声音数据库。分为哺乳动物叫声、鸟叫声和昆虫叫声3大类,每类声音有30个样本,具体如表1所示。每个样本是单声道“.wav”格式,采样率为44.1 kHz,声音长度为2 s,量化精度为16位的声音片段。实验中随机选取20个纯净声音样本作为训练样本,剩余10个样本混合不同的环境噪声组成多组测试样本。实验用到的3种噪声为SONY ICD-UX512F录音棒以44.1 kHz的采样频率录取的真实环境噪声,分别为风声、雷雨声和雨天湖边声,按信噪比-5 dB、0 dB、10 dB、20 dB、30 dB混入纯净声音用于测试。