《表3 标签-类型映射:基于命名实体识别的医疗文本零水印方案》

《表3 标签-类型映射:基于命名实体识别的医疗文本零水印方案》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于命名实体识别的医疗文本零水印方案》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

算法1中,对于医疗文本中任意一个实体Di,首先,依据文本T中字符与标签序列(Tag_sequence)之间的顺序对应关系,获取该实体的名称(Entity_name).按照实体在医疗文本中出现的先后顺序给每个实体分配一个序号(Entity_order),序号是实体的重要特征,能有效验证医疗文本内句子是否发生了移位.然后,执行算法第5行和第6行,分别获得某一实体在文本中的首字符位置索引和尾字符位置索引,使用实体首尾位置索引值计算实体的长度(Entity_length),实体长度信息能增强零水印抗非等长实体替换攻击的能力.执行算法第8行将实体的三个特征编码成二进制形式.其中,实体名称先转换成Unicode编码形式,进而转为二进制编码.接着,获取实体的标签信息(Entity_tag),根据标签-类型映射表3查找实体的类型,通过判断实体类型对应的映射值,对不同类型的实体特征编码进行分类,并保存于对应list_i中,如算法第9到20行所示.最后,融合所有类型的特征,返回该医疗文本实体特征DF,如算法第22和第23行所示.