《表2 包含较多被拆分单词的维吾尔文印刷体文档图像单词切分实验结果统计》
从表1可知在选取的5张文档图像中“<<>>”“()”“[]”三类标点符号共有80个,全部都切分正确,证明本文方法对此类与单词间间隙较小的标点符号的切分有很好的效果,同时保持较高的单词切分准确率。为验证本文方法对合并被拆分单词的有效性,从已有的100张文档图像中选取5张被拆分单词数目较多的文档图像进行单词切分实验,实验结果如表2所示。
图表编号 | XD00163033800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.15 |
作者 | 徐学斌、吾尔尼沙·买买提、阿力木江·艾沙、朱亚俐、库尔班·吾布力 |
绘制单位 | 新疆大学信息科学与工程学院、新疆大学图书馆、新疆大学教师工作部、新疆大学信息科学与工程学院、新疆大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |