《表5 文本结构标注信息:LinDEAP语言学学术英语语料库的创建》
文本内容标注是指对文本的结构进行XML标注。这一标注始于论文摘要,止于文章结尾。这一标注为我们进行语类分析、子库生成等提供了基础条件。我们对三种语类做了区分对待。首先,研究论文的标注信息参见表5。标注的层级局限于一级标题,没有深入到二级、三级标题,否则标注信息会出现较多的重叠与嵌套现象,造成混乱,也不利于后续研究的开展。在标注过程中,我们基于文本结构的实际情况,从表5中选择合适的标注符号进行标注。其次,综述论文正文的主体部分主要是文献综述(Literature Review),其前一般会有引言(Introduction),其后往往会有结论(Conclusion)。再次,没有对书评正文的内部结构做进一步的标注。
图表编号 | XD00214448300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.03.01 |
作者 | 布占廷、王昕、王乐 |
绘制单位 | 青岛大学 |
更多格式 | 高清、无水印(增值服务) |