《表1 数据集参数:基于差异点集的频繁项集挖掘算法》

《表1 数据集参数:基于差异点集的频繁项集挖掘算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于差异点集的频繁项集挖掘算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文将DNTK*与DNTK算法的运行时间比例在不同数据集中作对比(DNTK*为未采用包含索引策略的DNTK算法),以测试采用了包含索引策略的DNTK算法因减少项集连接次数所带来的时间效益。并且本文将DNTK算法与FAE和NTK算法在运行时间和内存占用方面进行比较,以验证该算法的整体性能。用java语言在实验环境为Inter(R)Core(TM)i5 [email protected] CPU,内存4GB,64位操作系统设备上实现以上算法比较,各组实验中每种算法所挖掘的频繁项集数量和内容是相同的,确保了实验公平性。实验所用数据集为常用数据集Retail,Connect,T10I4D100K和T2K50K1D,见表1。实验通过改变top rank value(k)的大小来测试算法运行时间和内存占用的情况。DNTK*算法与DNTK算法的运行时间比例实验结果如图2所示,DNTK算法与FAE和NTK算法的运行时间和内存占用对比实验结果分别如图3和图4所示。