《表5 关系类别的分布:基于汉英平行语料库的英文显式篇章关系识别》
经统计,语料中共标注显式关系462条,其中4大类关系的分布见表5,可以看到,仅并列关系有332条,占一半以上,转折关系所占比例最少.鉴于语料规模还较小,连接词存在数据稀疏问题,本次实验仅对462条给定的关系进行分类,由于本文所用语料是汉英平行语料,特征提取了英文连接词本身和对应的中文连接词两项特征,关系类别的识别对连接词本身的依赖性很强,使用英汉连接词本身可以取得较好的分类效果,连接词作为特征的分类性能见表6.
图表编号 | XD00106425800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.28 |
作者 | 冯洪玉、李艳翠、冯文贺 |
绘制单位 | 河南科技学院信息工程学院、河南科技学院信息工程学院、广东外语外贸大学 |
更多格式 | 高清、无水印(增值服务) |