《表1 数据集信息表:基于标签迁移和深度学习的跨语言实体抽取研究》
本次实验中,以英语作为源语言,数据来源于Co NLL2003公开数据集[42];以西班牙语和荷兰语为目标语言,数据来源于Co NLL2002公开数据集[43]。3种语言的训练集、验证集和测试集已划分好。例如,英语的训练集、验证集和测试集中分别包含单词数为204 567个、51 587个和46 666个。具体统计如表1所示。
图表编号 | XD00198118900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 余传明、黄婷婷、林虹君、安璐 |
绘制单位 | 中南财经政法大学信息与安全工程学院、中南财经政法大学统计与数学学院、中南财经政法大学信息与安全工程学院、武汉大学信息管理学院 |
更多格式 | 高清、无水印(增值服务) |