《表3 文字识别方法在2个ICDAR上的识别正确率对比》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《面向自然场景图像的三阶段文字识别框架》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

为验证本文方法的有效性，将其与较新的典型方法在2个ICDAR数据集上做定量比较，实验结果如表3所示。由表3可知，本文方法在ICDAR 2013上取得了较高的准确率，性能优于文献[22]和[23]中方法，这是因为通过矫正过程有效矫正了文字的不规则形变，进而增强了其阅读性和识别率。值得注意的是，表3中所列方法大多是针对分割后的单词图像进行的识别，其值为文字检测率在100%时的正确识别率。本框架直接用原始自然场景图像作为输入，先进行单词级文字检测与分割，再进行文字识别，此时的检测误差将累积至最终的识别结果中。因此，即便本文方法在数值上并非最优，但仍具较强竞争力，且其实用性更强。文献[9]也是面向自然场景开展的文字识别研究，并获得了较好的识别效果，但其文字检测模块采用的是设计成熟的文字检测网络，需要经过一定的预处理才能与矫正网络和识别网络融合。本文方法的文字检测模块包含FPN和BLSTMN，获得了更高的检测精度，且与后续的文字矫正模块、文字识别模块在同一框架中，算法更完整。

图表编号	XD00199985600 严禁用于非法目的
绘制时间	2021.01.01
作者	邹北骥、杨文君、刘姝、姜灵子
绘制单位	中南大学计算机学院、湖南省机器视觉与智慧医疗工程技术研究中心、中南大学计算机学院、湖南省机器视觉与智慧医疗工程技术研究中心、中南大学计算机学院、湖南省机器视觉与智慧医疗工程技术研究中心、中南大学计算机学院、湖南省机器视觉与智慧医疗工程技术研究中心
更多格式	高清、无水印（增值服务）