《表1 序列标注:基于BiLSTM-CRF的中医文本命名实体识别》
序列标注简单而言就是给定一串序列,对序列中存在的每个元素打上相应标记或标签,通过标签可以客观的对这一串序列进行深度分析。比如,某患者在某三级甲等中医院的一份医案主诉为“头痛畏寒,恶风,大便偏干,口苦”,我们希望在中医药特色诊疗的基础上,识别这份医案中所涉及到的中医症状,因此对这医案中的这句话的序列标注如表1所示,序号为1的是原始主诉句子,序号为2的为分词后主诉句子,序号为3的是进行序列标注后的主诉句子,“/s”用来表示句子进行分割的地方,这里标注采用BIO[23](Begin,Intermediate,Other)的表示方法,其中“B”表示词语首字,“I”表示词语非首字,“O”表示非关注词汇或标点。
图表编号 | XD00194809000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.20 |
作者 | 肖瑞、胡冯菊、裴卫 |
绘制单位 | 湖北中医药大学信息工程学院、湖北中医药大学第一临床学院、湖北中医药大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |