《表1 实验数据集详细信息》
本文在JNLPBA[18]和NCBI-disease[19]数据集中训练模型,数据集分布如表1所示。NCBI-disease数据集来源于793篇生物医学领域的摘要,主要包含疾病实体;JNLPBA数据集包含DNA、RNA、Cell_line、Cell_type、Protein五种实体,模型除了识别出实体,还需要给出实体的具体分类。数据集使用BIO标注方案:B代表Beginning,标注一个实体的开始部分;I代表Inside,标注组成实体的中间部分;O代表Outside,标注与实体无关的信息。
图表编号 | XD00201791400 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.10 |
作者 | 许力、李建华 |
绘制单位 | 华东理工大学信息科学与工程学院、华东理工大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |