《表1 语料库中实体类型和标签设置情况统计》
由于不准确的中文分词可能会对后续的命名实体识别任务带来误差传递问题[20],在本文语料标注过程中采用基于BIO策略的字标注方式,其中:B表示实体的开始,I表示实体非开始部分,O表示非实体部分,因此,标注语料库中标签类型一共有13种,如表1所示。
图表编号 | XD00163217600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.10 |
作者 | 莫天金、李韧、杨建喜、李童、蒋仕新、李东 |
绘制单位 | 重庆交通大学信息科学与工程学院、重庆交通大学信息科学与工程学院、重庆交通大学信息科学与工程学院、重庆交通大学信息科学与工程学院、重庆交通大学信息科学与工程学院、重庆交通大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |