《表1 卷积神经网络结构表》
在本文中使用基于卷积神经网络的方法来检测和识别目标手势。CNN由一个或多个互相连接的卷积层组成,是标准多层神经网络[12],合理的架构设计能够准确迅速识别2D视频中的特定目标[13-14]。CNN有两种类型,一种是基于区域候选的R-CNN系列算法(R-CNN,Fast R-CNN,Faster R-CNN),它们是两阶的,需要首先生成候选区域,然后再在候选区域上做分类与回归。第二种是一阶算法,只用单独的CNN同时识别不同手势的类别与位置。第一种相较于第二种具有准确度高的优点,第二类算法虽然准确度稍差一些,但是实时性好。经过实际测验,本文最终采用了YOLO算法[15],YOLO算法是一阶算法,运算速度快,而且提供端到端的手势检测。为了满足本文的实际应用需求,在原有的网络结构上进行了相应的改进,使其在实际测试中实现15帧每秒左右的处理速度,基本实现了实时处理。本系统改进后的网络结构,如表1所示。
图表编号 | XD00160049700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.25 |
作者 | 姬晓飞、王治博、王昱 |
绘制单位 | 沈阳航空航天大学自动化学院、沈阳航空航天大学自动化学院、沈阳航空航天大学自动化学院 |
更多格式 | 高清、无水印(增值服务) |