《表4 DA-NER模型在数据集上的生成数据和真实数据的例子》
为了进一步分析数据增强方法的有效性,笔者分析了不同数据集上的真实数据和生成数据,如表4所示.在CCKS 2019和CMID数据集上,真实数据中“胃”、“直肠癌”实体,在生成数据中变成了“下腹”、“肛瘘”实体,可见,数据增强的方法在生成数据时可以生成多样性的实体部分的数据.在CCKS2019和CMID数据集上,生成数据中的非实体部分“隐痛”替代了“可见癌转移”,生成数据中的非实体部分“怎么治疗”替代了“想买点药吃”,说明数据增强的方法在生成数据时也能生成多样性的非实体部分数据.同样地,在Weibo NER上,真实数据中的非实体部分“裸婚时代”在生成数据中变成了“30年前”,在Resume上,真实数据中的“刘昊维”,在生成数据中是“黄忠和”,表明数据增强方法在其他数据集上也能产生多样化的数据.
图表编号 | XD00183676400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.01 |
作者 | 王蓬辉、李明正、李思 |
绘制单位 | 北京邮电大学人工智能学院、北京邮电大学人工智能学院、北京邮电大学人工智能学院 |
更多格式 | 高清、无水印(增值服务) |