《表3 标签-类型映射:基于命名实体识别的医疗文本零水印方案》
算法1中,对于医疗文本中任意一个实体Di,首先,依据文本T中字符与标签序列(Tag_sequence)之间的顺序对应关系,获取该实体的名称(Entity_name).按照实体在医疗文本中出现的先后顺序给每个实体分配一个序号(Entity_order),序号是实体的重要特征,能有效验证医疗文本内句子是否发生了移位.然后,执行算法第5行和第6行,分别获得某一实体在文本中的首字符位置索引和尾字符位置索引,使用实体首尾位置索引值计算实体的长度(Entity_length),实体长度信息能增强零水印抗非等长实体替换攻击的能力.执行算法第8行将实体的三个特征编码成二进制形式.其中,实体名称先转换成Unicode编码形式,进而转为二进制编码.接着,获取实体的标签信息(Entity_tag),根据标签-类型映射表3查找实体的类型,通过判断实体类型对应的映射值,对不同类型的实体特征编码进行分类,并保存于对应list_i中,如算法第9到20行所示.最后,融合所有类型的特征,返回该医疗文本实体特征DF,如算法第22和第23行所示.
图表编号 | XD00223967600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.01 |
作者 | 龚礼春、姚晔、唐观根、吴国华 |
绘制单位 | 杭州电子科技大学网络空间安全学院、杭州电子科技大学网络空间安全学院、杭州电子科技大学计算机学院、杭州电子科技大学网络空间安全学院 |
更多格式 | 高清、无水印(增值服务) |