《表2 字符特征:基于命名实体识别的医疗文本零水印方案》
(a)顺序取出医疗文本字符,赋予每个字符对应偏旁部件与词性标注后,输入到嵌入层中.嵌入层将字符转化为向量,其中,字符与偏旁部件使用Word2Vec模型与预训练好的偏旁部件模型向量化,词性标注采用随机向量化.将字符向量eic,偏旁部件向量eir,词性向量eip,通过连接层处理后组成单行向量et.字符特征构成如表2所示.该表中“糖尿病”属于疾病与诊断一类,其首字符标签为B-disease,中间字符标签为I-disease,尾字符标签为E-disease,非实体字符被标记为O.
图表编号 | XD00223967500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.01 |
作者 | 龚礼春、姚晔、唐观根、吴国华 |
绘制单位 | 杭州电子科技大学网络空间安全学院、杭州电子科技大学网络空间安全学院、杭州电子科技大学计算机学院、杭州电子科技大学网络空间安全学院 |
更多格式 | 高清、无水印(增值服务) |