《表1 桶的计数值:面向隐私保护的频繁项集挖掘算法》
构造完MFI集合B和候选项集合C后,对项集的支持度添加拉普拉斯噪声。若集合C中包含项集个数少于k,则直接对其支持度进行加噪并输出;若项集个数大于k,则先对其支持度添加拉普拉斯噪声,再挑选出支持度前k大的项集。加噪过程如下:将数据集中所有事务根据最大频繁项集Bi分成2Bi个互不相交的桶,每个桶对应Bi的一个子集。为了降低敏感度,分别对每个桶的计数添加拉普拉斯噪声,利用这些桶的计数计算候选集C中每个项集的支持度。例如,一个数据集包含8条事务,分别为{a},{a,b},{a,b,c},{b},{a,c},{d},{d,e},{f},求得的MFI集合为B={B1,B2},其中,B1={a,b,c},B2={d,e,f},则分解后的桶及其计数如表1所示。
图表编号 | XD0044937600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.10 |
作者 | 蒋辰、杨庚、白云璐、马君梅 |
绘制单位 | 南京邮电大学计算机学院、江苏省大数据安全与智能处理重点实验室、南京邮电大学计算机学院、江苏省大数据安全与智能处理重点实验室、南京邮电大学计算机学院、南京中医药大学信息技术学院、31436部队 |
更多格式 | 高清、无水印(增值服务) |