《表3 文字识别方法在2个ICDAR上的识别正确率对比》

《表3 文字识别方法在2个ICDAR上的识别正确率对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向自然场景图像的三阶段文字识别框架》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为验证本文方法的有效性,将其与较新的典型方法在2个ICDAR数据集上做定量比较,实验结果如表3所示。由表3可知,本文方法在ICDAR 2013上取得了较高的准确率,性能优于文献[22]和[23]中方法,这是因为通过矫正过程有效矫正了文字的不规则形变,进而增强了其阅读性和识别率。值得注意的是,表3中所列方法大多是针对分割后的单词图像进行的识别,其值为文字检测率在100%时的正确识别率。本框架直接用原始自然场景图像作为输入,先进行单词级文字检测与分割,再进行文字识别,此时的检测误差将累积至最终的识别结果中。因此,即便本文方法在数值上并非最优,但仍具较强竞争力,且其实用性更强。文献[9]也是面向自然场景开展的文字识别研究,并获得了较好的识别效果,但其文字检测模块采用的是设计成熟的文字检测网络,需要经过一定的预处理才能与矫正网络和识别网络融合。本文方法的文字检测模块包含FPN和BLSTMN,获得了更高的检测精度,且与后续的文字矫正模块、文字识别模块在同一框架中,算法更完整。