《表3 Base CNN中的配置参数》

《表3 Base CNN中的配置参数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《真实环境下的多模态情感数据集MED》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:“-”为无数据。

在基准实验中,尝试使用了传统的机器学习方法提取的方向梯度直方图(histogram of oriented gradient,HOG)(Dalal和Triggs,2005),局部二值模式(local binary patterns,LBP)(Ahonen等,2004),Gabor(Liu和Wechsler,2002)特征。提取LBP特征时,将图像调整为128×128像素大小,分割为8×8区域,采用等价模式,即59类,最后每幅图像得到3 776维特征向量。HOG特征同样使用128×128像素的图像作为输入,采用16×16的区间(block),步长为8,每个细胞单元(cell)大小为8×8,将方向梯度均匀分为9个方向(bin),共提取8 100维的HOG特征向量。对于Gabor小波,本文将人脸图像调整为16×16像素,在16个空间尺度和8个方向上使用了共128个Gabor滤波器。将每幅图像分为10×10的小块,每个小块用128个滤波器进行滤波,最后得到12 800维的特征向量。用LBP、HOG、Gabor小波进行特征提取后,使用支持向量机(support vector machine,SVM)(Cortes和Vapnik,1995)作为分类器进行分类。分类之前生成的特征向量先利用主成分分析法(principal component analysis,PCA)进行降维。其中用在SVM分类器前的PCA阈值百分比分别为0.99、0.99和0.97。另外,使用深度学习的方法对两个数据集进行了评估,搭建了Base C-NN,具体的参数配置见表3。网络的输入为128×128像素的图像,批次大小为40,初始学习率为0.01。