《表3 三种语音情感特征的相关系数归一化结果Tab.3 Correlation coefficient normalization of three speech emotion features》下

《表3 三种语音情感特征的相关系数归一化结果Tab.3 Correlation coefficient normalization of three speech emotion features》下   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《PAD三维情感空间中的语音情感识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

利用提取的三种语音情感特征,建立情感语音识别预测模型,本文SVR回归算法选用高斯径向基函数,实验样本的80%作为训练集,剩余样本作为测试集检验预测效果.表3是以CASIA数据库中文本内容为“阳光使得你们温暖”,情感标签为高兴的测试数据为例,得到的三种特征的相关系数归一化结果.首先将该语音的MFCC特征作为SVR的输入参数,SVR的输出结果为该情感语音的PAD值,然后计算该预测值与PAD量表值的Pearson相关系数.同理,继续利用该语音情感数据的点火时间序列和点火位置信息特征进行P、A、D值预测,计算Pearson相关系数.根据表3中相关性分析结果我们可知道,不同的特征在P(愉悦度)、A(激活度)和D(优势度)三个维度上所对应的相关系数存在差别,其中P、A的相关系数由大到小的顺序是点火位置信息特征、时间点火序列、MFCC,而D的相关系数由大到小的顺序为时间点火序列、点火位置信息特征、MFCC,表明三种特征在语音情感识别的准确率中各有侧重.因此,在对语音情感进行识别时,不宜选取单一特征,而应根据相关系数的大小给三种特征赋予不同的权值以提高识别精度.