《表3“老虎”分类音频18.wav的MFCC倒谱特征矩阵》

《表3“老虎”分类音频18.wav的MFCC倒谱特征矩阵》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《跨媒体知识图谱构建中多模态数据语义相关性研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

利用梅尔频率倒谱系数(MFCC)算法对分类训练集中的音频对象提取其声谱图和倒谱特征矩阵。以“老虎”分类中音频文件18.wav为例,通过MFCC倒谱分析,得到如图4所示的声谱图和一个554×24的二维数组(见表3),该数组即为描述语音对象的倒谱向量。为分析MFCC算法对音频模态数据底层特征提取的有效性,本文对语音训练样本进行了相似性计算,相似性矩阵如表4所示。尽管由于随机采集的样本长短不一和有其他噪声的影响,通过对音频对象的MFCC倒谱向量的相似性计算,实验结果表明相同高层语义的音频对象间具有明显较高的相似性。