《表3 数据规模统计:基于弱标注数据的汉语分词领域移植》
我们分别在两种不同来源的数据集上进行实验,分别是SIGHAN Bakeoff 2010评测数据以及ZX数据集。其中,SIGHAN Bakeoff 2010评测数据包含四个具体的领域,包括Finance(Fin),Medicine(Med),Literature(Lit),Computer(Com)。ZX数据集来源于网络小说。为了与前人的工作进行比较,我们采用Jiang等[9]和Liu等[10]的实验设置,将PD作为源领域训练数据去测试SIGHAN Bakeoff 2010评测数据。同时,我们采用Liu等[10]的实验设置,使用CTB5作为源领域训练数据去测试ZX数据。具体的数据规模统计如表3所示。
图表编号 | XD0091813800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 朱运、李正华、黄德朋、张民 |
绘制单位 | 苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |