《表1 文字检测方法在ICDAR 2013上的性能对比》
为验证本文方法对文字检测的有效性,选取几个较新的典型方法,在ICDAR 2013和ICDAR 2015数据集上进行定量比较,实验结果如表1和表2所示。由表1和表2知,本文方法在R,P和F分数指标上都表现较好。锚点框回归方法(如RRPN[4]、Text Boxes++[5])依赖大量人工设计匹配文字特征区域的锚点,还需考虑随机排列文字的方向特性;而本文通过FPN直接分割文字像素,通过BLSTMN捕获字符间的上下文信息,显著改进了对随机排版文字的识别。相较一般的实例分割方法(如Seg Link[7]、Pixel Link[6]),本文方法通过FPN将局部与全局的文字特征相融合,实现对不同大小文字的分割,从而获得更高的文字字符召回率和检测精度。值得一提的是,CRAFT方法[8]凭借弱监督学习和像素级字符连接获得了最佳的检测性能。
图表编号 | XD00199985000 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.01 |
作者 | 邹北骥、杨文君、刘姝、姜灵子 |
绘制单位 | 中南大学计算机学院、湖南省机器视觉与智慧医疗工程技术研究中心、中南大学计算机学院、湖南省机器视觉与智慧医疗工程技术研究中心、中南大学计算机学院、湖南省机器视觉与智慧医疗工程技术研究中心、中南大学计算机学院、湖南省机器视觉与智慧医疗工程技术研究中心 |
更多格式 | 高清、无水印(增值服务) |