《表1 医疗数据表中不同类型属性的示例》

《表1 医疗数据表中不同类型属性的示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《隐私保护技术在健康医疗大数据发布中的应用研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

针对患者身份类型隐私泄露并不能简单地使用阻止身份信息泄漏的隐私保护技术完成,而需要专门的算法和技术,主要目的是限制攻击者推断个人记录包含在医疗数据集D中的能力。现有针对身份类型泄漏的隐私保护技术大都使用不同的数据泛化技术对准标识符进行转换,目的是找到一种信息丢失率低并限制攻击者推断个人记录是否包含在数据集中能力的解决方案。以隐私保护算法SPALM和MPALM为例[8-9]。两种算法都采用自顶向下的方法搜索所有可能的泛化,但它们的泛化方法不同。SPALM将准标识符的值以相同的方式进行泛化(例如值为“西安”的所有记录都被泛化为“陕西”),而MPALM算法允许准标识符中具有相同值的两个记录以不同的方式进行泛化(例如,将一个值为“西安”的记录泛化为“陕西”,另一个泛化为“中国”)。表3为在表1基础上进行SPALM泛化处理,满足SPALM的隐私保护模型能够提供保护患者身份信息的隐私保护,因此它保证了攻击者推断某位患者记录是否包含在数据集D中的概率在一个可接受的范围内。