《表3 ACE2005中文数据来源的分布Tab.3 Distribution of Chinese data sources for ACE2005dataset》
ACE2005中文语料的来源被分为3类:新闻专线(NW,newswire)、广播新闻(BN,broadcast news)和网络日志(WL,Weblog),表3显示了数据来源的分布情况。该语料包含多种实体关系,分为6大类和18个小类,表4显示了6个大类的数量分布。按照各类所占的比例,我们随机选择2/3作为训练集,1/3作为测试集。
图表编号 | XD0032537700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.25 |
作者 | 武文雅、陈钰枫、徐金安、张玉洁 |
绘制单位 | 北京交通大学计算机与信息技术学院、北京交通大学计算机与信息技术学院、北京交通大学计算机与信息技术学院、北京交通大学计算机与信息技术学院 |
更多格式 | 高清、无水印(增值服务) |