《表1 软硬件配置:大数据环境中交互式查询差分隐私保护模型》
实验从数据可用性和算法性能角度对比IQDPPBD、LRM[22]和MM[21]。实验采用frequent itemset mining data repository[29]的Webdocs数据集,该数据集每条记录代表顾客的购买行为,把顾客购买的一个商品作为一个数据项。选取其中160 000条数据作为原始数据集,随机生成m个批查询。为了验证并行性同时考虑可扩展性,采用分布式集群验证实验。常用的分布式集群实验平台主要有MPI和Hadoop。但由于MPI存在节点失效、网络通信故障等问题,本实验选用开源的Hadoop来实现IQDPPBD,并用算法的运算时间来衡量算法性能。本实验模型用Java语言实现。由于差分隐私添加噪声具有一定的随机性,最终结果取20次实验结果的平均值。实验单机环境为IntelCoreTMi7 CPU 3.4 GHz,8 GB内存,Windows 7操作系统。分布式环境如表1所示。
图表编号 | XD0090292000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 袁健、王迪、申泽宇 |
绘制单位 | 上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院 |
更多格式 | 高清、无水印(增值服务) |