《表1 GAUSS1的参数》

《表1 GAUSS1的参数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于MapReduce和Spark的大数据模糊K-means算法比较》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验所用的数据集包括3个人工大数据集和4个UCI数据集,对基于2种开源平台的大数据模糊K-means算法从运行时间和迭代次数2方面进行了实验比较.为描述方便,基于MapReduce的模糊K-均值算法记为MK-Means,基于Spark的模糊K-均值算法记为SK-Means.4个UCI数据集分别是Covtype、HT_Sensor、Poker-hand-testing和SUSY;3个人工大数据集都是用高斯分布生成的.第1个人工数据集GAUSS1是一个2类包含100万个点的数据集,每类包含50万个样例.2类服从的高斯分布为p(x|ωi)~N(μi,i),i=1,2,参数列于表1中.