本书为我国首部全面阐述关于中文印刷体文档识别基本原理,基本方法及其实现算方的著作。目前仅具有汉字和符号识别功能的印刷体识别软件(OCR)已在实际中得到广泛应用,但是一个中文文档中不仅含有汉字,还含有英文以及各种各样的公式及图表。而现阶段的中文文档识别软件并不能对公式进行识别,迫切需要一种既能识别汉字又能识别公式的较为全面的中文文档识别系统。针对这一现状,本书作者近十年来重点开展了公式识别的研究,从中文印刷体文档图像的预处理、版面分析、文字和符号识别、公式定位和识别、表格识别和文档中的图形图像处理等方面全面介绍了中文印刷体文档识别的技术细节,结合作者多年来在公式识别方面取得的研究成果重点给出了公式的定位与提取和公式的结构分析的理论与方法。本书还给出了一个含有文字、公式和表格识别功能的中文印刷体文档识别系统软件实现方法及相应的实现代码。

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。