《表1 卷积神经网络结构表》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《视频手势识别的互动演示系统的设计与实现》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在本文中使用基于卷积神经网络的方法来检测和识别目标手势。CNN由一个或多个互相连接的卷积层组成，是标准多层神经网络[12]，合理的架构设计能够准确迅速识别2D视频中的特定目标[13-14]。CNN有两种类型，一种是基于区域候选的R-CNN系列算法（R-CNN，Fast R-CNN，Faster R-CNN），它们是两阶的，需要首先生成候选区域，然后再在候选区域上做分类与回归。第二种是一阶算法，只用单独的CNN同时识别不同手势的类别与位置。第一种相较于第二种具有准确度高的优点，第二类算法虽然准确度稍差一些，但是实时性好。经过实际测验，本文最终采用了YOLO算法[15]，YOLO算法是一阶算法，运算速度快，而且提供端到端的手势检测。为了满足本文的实际应用需求，在原有的网络结构上进行了相应的改进，使其在实际测试中实现15帧每秒左右的处理速度，基本实现了实时处理。本系统改进后的网络结构，如表1所示。

图表编号	XD00160049700 严禁用于非法目的
绘制时间	2020.04.25
作者	姬晓飞、王治博、王昱
绘制单位	沈阳航空航天大学自动化学院、沈阳航空航天大学自动化学院、沈阳航空航天大学自动化学院
更多格式	高清、无水印（增值服务）