《表1 D_Apriori算法伪代码》
经过两次迭代后可能的最大频繁项集中集合最大长度分别为min_length=3,max_length=6,即下次迭代需要产生频繁项集中集合的长度为4,产生的4-项备选集为{{I1,I2,I3,I5},{I1,I2,I3,I6},{I1,I2,I4,I6},{I2,I3,I4,I6}},由于经过剪枝操作得到频繁4-项集为空,即均不满足最小支持度,所以可以得到最大频繁项集为频繁3-项集。与经典Apriori算法相比,计算频繁项集时不再依次产生频繁项集,而是可以越过一些频繁项集产生高阶频繁项集,本例中经典Apriori算法需要经过4次迭代分别产生频繁1-、2-、3-、4-项集,再经过判断得到最大频繁项集为频繁3-项集,而改进的算法在计算过程中需要产生的频繁项集次数更少,即需要迭代的次数更少,计算效率得到了提升。
图表编号 | XD00147473400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.20 |
作者 | 叶峰 |
绘制单位 | 武汉邮电科学研究院 |
更多格式 | 高清、无水印(增值服务) |