《表1 基于静态图像的深度人脸表情识别算法在常见数据库上的性能比较》
注:1)括号内的数值为平均精确度,由混淆矩阵对角线均值得出。2) 7类:生气、蔑视、厌恶、害怕、开心、伤心和惊讶;8类:生气、蔑视、厌恶、害怕、开心、伤心、惊讶和中立。CK+为the extended Cohn-Kanade database,MMI为Maja Pantic,Michel Valstar Initiative。
表1展示了目前有代表性的基于静态图像的深度人脸表情识别算法在常见数据库上的性能比较。接下来,本文对不同类别网络的优缺点进行讨论。多网络融合模型在特征层次或者决策层次融合了不同子网络的优点,并广泛应用于表情识别竞赛中来提高最终的识别率。然而,设计不同类型用于互补的子网络也大大增加了模型计算量和储存空间。此外,由于不同子网络的权重通常是基于现有的训练集或者验证集学习得到的,这导致学习而来的参数易在测试集上过拟合。多任务网络则在训练表情识别任务的同时也考虑了其他与表情相关联的任务,例如面部特征点定位、面部肌肉单元检测和人脸识别,从而排除了与表情无关的干扰因素的影响。该方法的主要缺陷是其要求更多的与其他任务相关的标签参与训练,并使得训练量更大。级联网络则将不同子网络串联在一起,逐步加强了模型的判别能力。该方法能够有效避免过拟合问题并排除与表情无关因素的干扰。此外,生成对抗网络因其可生成高质量目标样本的优点也逐渐应用于表情识别领域中,进行姿态不变的表情识别或者增加训练样本的数量和多样性。
图表编号 | XD00201376000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.16 |
作者 | 李珊、邓伟洪 |
绘制单位 | 北京邮电大学人工智能学院、北京邮电大学人工智能学院 |
更多格式 | 高清、无水印(增值服务) |