《表1 数据集参数:基于差异点集的频繁项集挖掘算法》
本文将DNTK*与DNTK算法的运行时间比例在不同数据集中作对比(DNTK*为未采用包含索引策略的DNTK算法),以测试采用了包含索引策略的DNTK算法因减少项集连接次数所带来的时间效益。并且本文将DNTK算法与FAE和NTK算法在运行时间和内存占用方面进行比较,以验证该算法的整体性能。用java语言在实验环境为Inter(R)Core(TM)i5 [email protected] CPU,内存4GB,64位操作系统设备上实现以上算法比较,各组实验中每种算法所挖掘的频繁项集数量和内容是相同的,确保了实验公平性。实验所用数据集为常用数据集Retail,Connect,T10I4D100K和T2K50K1D,见表1。实验通过改变top rank value(k)的大小来测试算法运行时间和内存占用的情况。DNTK*算法与DNTK算法的运行时间比例实验结果如图2所示,DNTK算法与FAE和NTK算法的运行时间和内存占用对比实验结果分别如图3和图4所示。
图表编号 | XD00137198100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.16 |
作者 | 尹远、朱璐伟、文凯 |
绘制单位 | 重庆邮电大学通信与信息工程学院、重庆邮电大学通信新技术应用研究中心、中国电信股份有限公司重庆分公司、重庆邮电大学通信与信息工程学院、重庆邮电大学通信新技术应用研究中心、重庆邮电大学通信与信息工程学院、重庆邮电大学通信新技术应用研究中心、重庆信科设计有限公司 |
更多格式 | 高清、无水印(增值服务) |