《表1 帧级的低层次声学特征(LLDs)及统计函数[12]》
使用openSMILE工具包将音频分割为帧,计算LLD,最后应用全局统计函数。本文参考了Interspeech2010年泛语言学挑战赛(Paralinguistic challenge)[12]中广泛使用的特征提取配置文件“embose2010.conf”。它包含了38个低层次的声学特征(如MFCC,音量等),21个全局统计函数应用于低层次的声学特征和它们相应的系数。这些统计函数包括最大最小值、均值、时长、方差等,如表1所示。因此,声学特征向量的维数是1 582。
图表编号 | XD0074250100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.01 |
作者 | 冯亚琴、沈凌洁、胡婷婷、王蔚 |
绘制单位 | 南京师范大学教育科学学院、南京师范大学教育科学学院、南京师范大学教育科学学院、南京师范大学教育科学学院 |
更多格式 | 高清、无水印(增值服务) |