《表1 CK+数据集上的整体精度》
注:加粗字体表示最优结果,DTAGN表示deep temporal appearance-geometry network;PPDN表示peak-piloted deep network;FN2EN表示Face Net2ExpNet;MDSTFN表示deep spatial-temporal feature fusion neural network;DSAN表示deeplysupervised attention network。
CK+(Lucey等,2010)为实验室环境下收集的数据集,包含来自123个受试者的593个视频序列。实验中进行6类基本表情的分类,仅从106个受试者中选择了309个序列,然后提取每个序列中表情强度达到峰值的最后3帧,得到927幅图像。最后,将所选图像按人物ID升序分为10个子集,进行身份无关的十折交叉验证。交叉验证的平均精度如表1所示。从表1中可以看出,本文方法达到了98.7%的识别率,使用更加简单的网络结构MobileFaceNet,达到了与当前先进算法接近的结果。图3展示了CK+上的混淆矩阵,可以看到算法识别厌恶、开心和悲伤这3类表情的效果最好,而生气和恐惧样本数量更少,相对难识别。
图表编号 | XD00201378300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.16 |
作者 | 江静、邓伟洪 |
绘制单位 | 北京邮电大学人工智能学院、北京邮电大学人工智能学院 |
更多格式 | 高清、无水印(增值服务) |