《表5 文本结构标注信息:LinDEAP语言学学术英语语料库的创建》

《表5 文本结构标注信息:LinDEAP语言学学术英语语料库的创建》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《LinDEAP语言学学术英语语料库的创建》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

文本内容标注是指对文本的结构进行XML标注。这一标注始于论文摘要,止于文章结尾。这一标注为我们进行语类分析、子库生成等提供了基础条件。我们对三种语类做了区分对待。首先,研究论文的标注信息参见表5。标注的层级局限于一级标题,没有深入到二级、三级标题,否则标注信息会出现较多的重叠与嵌套现象,造成混乱,也不利于后续研究的开展。在标注过程中,我们基于文本结构的实际情况,从表5中选择合适的标注符号进行标注。其次,综述论文正文的主体部分主要是文献综述(Literature Review),其前一般会有引言(Introduction),其后往往会有结论(Conclusion)。再次,没有对书评正文的内部结构做进一步的标注。