《表5 四库句偏误标注代码比较表[3]》

《表5 四库句偏误标注代码比较表[3]》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《关于汉语中介语语料库标注代码的思考》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

结合表格中的内容及四库的标注规范,我们可以总结出如下几点内容:(1)建立较早的中山库和HSK库在标注内容方面涉及的层面基本一致,主要包括字、词、句、篇、标点等内容。(2)中山库、HSK库和全球库偏误标注代码的设计均采用汉语拼音首字母的方式进行编码,但具体标注项的标注代码存在差别(详见下文的表3、表4、表5)。与中山库和HSK库相比,全球库的标注代码更多、更全、更有系统性[1]。(3)四库在偏误标注代码设计方面均考虑到了语言学分类系统和与目标语差异系统。中山库、HSK库和台师库的标注代码设计将与目标语差异系统代码放在前,将语言学分类系统代码放在后,而全球库则是语言学分类系统代码在前,与目标语差异系统代码用“[]”来表示,如:中山库、HSK库、台师库和全球库关于“把”字句偏误的标注代码分别为:CYba,把字句错用;{CJba},把字句错误;M/R/S/W+ba,把字句偏误;[JSba],把字句偏误。