《表2 常见错误的识别效果》

《表2 常见错误的识别效果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《语法分析与纠错相结合的文档结构重构方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
%

本实验采用北京信息科技大学的学位论文来验证容错处理能力方面的识别效果。我们选择了50篇共含有108个错误测试点的文本结构样例。由于文档的保密要求,本文选择了在github上公布的68篇数据(https://github.com/COSLab)。每篇样例都含有一个或多个错误。我们利用左角分析法和纠错规则相结合的算法进行纠错,共纠正错误96个,其中真正的错误89个,准确率为92.71%,召回率为82.41%。对于常见的错误处理情况如表2所示。