《表1 帧级的低层次声学特征（LLDs）及统计函数[12]》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《利用语音与文本特征融合改善语音情感识别》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

使用openSMILE工具包将音频分割为帧，计算LLD，最后应用全局统计函数。本文参考了Interspeech2010年泛语言学挑战赛（Paralinguistic challenge）[12]中广泛使用的特征提取配置文件“embose2010.conf”。它包含了38个低层次的声学特征（如MFCC，音量等），21个全局统计函数应用于低层次的声学特征和它们相应的系数。这些统计函数包括最大最小值、均值、时长、方差等，如表1所示。因此，声学特征向量的维数是1 582。

图表编号	XD0074250100 严禁用于非法目的
绘制时间	2019.07.01
作者	冯亚琴、沈凌洁、胡婷婷、王蔚
绘制单位	南京师范大学教育科学学院、南京师范大学教育科学学院、南京师范大学教育科学学院、南京师范大学教育科学学院
更多格式	高清、无水印（增值服务）