《表3 语音与文本多特征在IEMOCAP上的识别结果》
注:+:特征层的融合;⊕:决策层的融合。
表4列出了语音特征与文本特征的决策层融合在IEMOCAP数据集上的识别结果。从表4可以看出语音与文本特征的决策层融合的UAR和ACC都高于特征的特征层融合。基于CNN的词袋、2-gram、声学和韵律特征的决策层融合取得了最好的结果,UAR为68.98%。相较于语音与文本特征的特征层融合最好的结果提高了7.79%。由此可证明语音与文本特征的决策层融合比特征层融合在情感识别任务中表现更好。同时基于CNN分类器的情感识别取得了最好的UAR为68.98%,超过了此前在IEMOCAP数据集上的最好结果。
图表编号 | XD0074250000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.01 |
作者 | 冯亚琴、沈凌洁、胡婷婷、王蔚 |
绘制单位 | 南京师范大学教育科学学院、南京师范大学教育科学学院、南京师范大学教育科学学院、南京师范大学教育科学学院 |
更多格式 | 高清、无水印(增值服务) |