《表1 3D Res Net网络参数》

《表1 3D Res Net网络参数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《结合残差网络及目标掩膜的人脸微表情识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在实验过程中,对于原始的微表情视频序列,本文首先通过TIM模型[17]进行视频归一化,进而统一视频序列的时间尺度。表1是将微表情视频序列帧数统一为64帧时各参数的设置情况,随后微表情视频序列的尺寸统一设置为112×112作为网络的输入。表中还包括了网络整体结构中卷积核、步长、通道、各网络层以及输出尺寸等参数的设置。其中S1和S2分别表示设置的时间步长及空间步长。首先通过对原始的微表情序列进行4×4×4时空卷积。随后经过第一次三维卷积后图像的输出尺寸缩减为16×56×56,接着是它的一个残差块结构,每一个大的残差块里有两个残差单元。引入残差单元可以让浅层的特征在深层继续被重复利用,并且残差块内的卷积都是采用1×1×1和3×3×3的小卷积核进行的卷积运算,能够较好地学习微表情中变化微弱的特征信息。训练阶段设置网络的学习率和正则化率统一为0.001,epoch次数(所有训练样本训练次数)设置范围为30~50,batchsize(每批样本的大小)设置范围为5~10。在后期训练过程中还需不断地观察输出损失值的变化,再根据输出的损失值,以10倍速率慢慢降低学习率。当输出的损失值达到一个足够低的水平且不再下降时,就及时停止训练,通常这时模型能达到一个较好的拟合效果。