《表3“老虎”分类音频18.wav的MFCC倒谱特征矩阵》
利用梅尔频率倒谱系数(MFCC)算法对分类训练集中的音频对象提取其声谱图和倒谱特征矩阵。以“老虎”分类中音频文件18.wav为例,通过MFCC倒谱分析,得到如图4所示的声谱图和一个554×24的二维数组(见表3),该数组即为描述语音对象的倒谱向量。为分析MFCC算法对音频模态数据底层特征提取的有效性,本文对语音训练样本进行了相似性计算,相似性矩阵如表4所示。尽管由于随机采集的样本长短不一和有其他噪声的影响,通过对音频对象的MFCC倒谱向量的相似性计算,实验结果表明相同高层语义的音频对象间具有明显较高的相似性。
图表编号 | XD0039038800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.28 |
作者 | 熊回香、杨滋荣、蒋武轩 |
绘制单位 | 华中师范大学信息管理学院、华中师范大学信息管理学院、贵州财经大学信息学院、华中师范大学信息管理学院 |
更多格式 | 高清、无水印(增值服务) |