《表3 Base CNN中的配置参数》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《真实环境下的多模态情感数据集MED》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

注:“-”为无数据。

在基准实验中，尝试使用了传统的机器学习方法提取的方向梯度直方图（histogram of oriented gradient，HOG）（Dalal和Triggs，2005），局部二值模式（local binary patterns，LBP）（Ahonen等，2004），Gabor（Liu和Wechsler，2002）特征。提取LBP特征时，将图像调整为128×128像素大小，分割为8×8区域，采用等价模式，即59类，最后每幅图像得到3 776维特征向量。HOG特征同样使用128×128像素的图像作为输入，采用16×16的区间（block），步长为8，每个细胞单元（cell）大小为8×8，将方向梯度均匀分为9个方向（bin），共提取8 100维的HOG特征向量。对于Gabor小波，本文将人脸图像调整为16×16像素，在16个空间尺度和8个方向上使用了共128个Gabor滤波器。将每幅图像分为10×10的小块，每个小块用128个滤波器进行滤波，最后得到12 800维的特征向量。用LBP、HOG、Gabor小波进行特征提取后，使用支持向量机（support vector machine，SVM）（Cortes和Vapnik，1995）作为分类器进行分类。分类之前生成的特征向量先利用主成分分析法（principal component analysis，PCA）进行降维。其中用在SVM分类器前的PCA阈值百分比分别为0.99、0.99和0.97。另外，使用深度学习的方法对两个数据集进行了评估，搭建了Base C-NN，具体的参数配置见表3。网络的输入为128×128像素的图像，批次大小为40，初始学习率为0.01。

图表编号	XD00201377400 严禁用于非法目的
绘制时间	2020.11.16
作者	陈静、王科俊、赵聪、殷超群、黄自强
绘制单位	哈尔滨工程大学自动化学院、哈尔滨工程大学自动化学院、哈尔滨工程大学自动化学院、哈尔滨工程大学自动化学院、哈尔滨工程大学自动化学院
更多格式	高清、无水印（增值服务）