《表1 GALE汉英平行语料库CCTV新闻及CNN本族语语料库构成》
本研究基于的汉英平行语料库,取自Yixiao Ma创建并分别于2007年9月17日、2008年7月16日及2008年9月15日发布的“GALE一期汉语广播新闻平行文本-第一部分、第二部分及第三部分”(Ma&Strassel 2007,2008a,2008b),包含中国中央电视台(CCTV)-中国大陆的电视台和凤凰卫视(设在香港的卫星电视台)的23.3、21.9及19.1小时的汉语广播新闻节目转写及相应英文译文,二者播报形式和内容时段基本对应。所有音频文件由LDC标注器及专业转写机构完成。人工句子单位/语段标注也算作转写工作的一部分。最后识别出三类句子单位:(1)陈述句子单位;(2)疑问句子单位;(3)不完整句子单位。转写和句子单位标注后,文档重新调整为人可读的格式,由专业译者进行仔细翻译。译者遵守LDC的GALE翻译指导原则,旨在描写翻译团队的构成、源数据格式、翻译数据格式、翻译特定语言特征(如名字和言语不流利)的最优译法以及对完成译文的质量控制步骤。语料代表了聚焦当前事件的新闻节目,如2004年和2005年度CCTV的“每日新闻”、凤凰卫视的“全球大视野”和“新闻早班车”。(见表1)
图表编号 | XD00141940500 严禁用于非法目的 |
---|---|
绘制时间 | |
作者 | 郁伟伟 |
绘制单位 | 浙江外国语学院 |
更多格式 | 高清、无水印(增值服务) |