《表3 数据规模统计:基于弱标注数据的汉语分词领域移植》

《表3 数据规模统计:基于弱标注数据的汉语分词领域移植》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于弱标注数据的汉语分词领域移植》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

我们分别在两种不同来源的数据集上进行实验,分别是SIGHAN Bakeoff 2010评测数据以及ZX数据集。其中,SIGHAN Bakeoff 2010评测数据包含四个具体的领域,包括Finance(Fin),Medicine(Med),Literature(Lit),Computer(Com)。ZX数据集来源于网络小说。为了与前人的工作进行比较,我们采用Jiang等[9]和Liu等[10]的实验设置,将PD作为源领域训练数据去测试SIGHAN Bakeoff 2010评测数据。同时,我们采用Liu等[10]的实验设置,使用CTB5作为源领域训练数据去测试ZX数据。具体的数据规模统计如表3所示。