《表4 DA-NER模型在数据集上的生成数据和真实数据的例子》

《表4 DA-NER模型在数据集上的生成数据和真实数据的例子》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据增强的中文医疗命名实体识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了进一步分析数据增强方法的有效性,笔者分析了不同数据集上的真实数据和生成数据,如表4所示.在CCKS 2019和CMID数据集上,真实数据中“胃”、“直肠癌”实体,在生成数据中变成了“下腹”、“肛瘘”实体,可见,数据增强的方法在生成数据时可以生成多样性的实体部分的数据.在CCKS2019和CMID数据集上,生成数据中的非实体部分“隐痛”替代了“可见癌转移”,生成数据中的非实体部分“怎么治疗”替代了“想买点药吃”,说明数据增强的方法在生成数据时也能生成多样性的非实体部分数据.同样地,在Weibo NER上,真实数据中的非实体部分“裸婚时代”在生成数据中变成了“30年前”,在Resume上,真实数据中的“刘昊维”,在生成数据中是“黄忠和”,表明数据增强方法在其他数据集上也能产生多样化的数据.