《表1 GAUSS1的参数》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于MapReduce和Spark的大数据模糊K-means算法比较》
实验所用的数据集包括3个人工大数据集和4个UCI数据集,对基于2种开源平台的大数据模糊K-means算法从运行时间和迭代次数2方面进行了实验比较.为描述方便,基于MapReduce的模糊K-均值算法记为MK-Means,基于Spark的模糊K-均值算法记为SK-Means.4个UCI数据集分别是Covtype、HT_Sensor、Poker-hand-testing和SUSY;3个人工大数据集都是用高斯分布生成的.第1个人工数据集GAUSS1是一个2类包含100万个点的数据集,每类包含50万个样例.2类服从的高斯分布为p(x|ωi)~N(μi,i),i=1,2,参数列于表1中.
图表编号 | XD00147991700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.25 |
作者 | 翟俊海、田石、张素芳、王谟瀚、宋丹丹 |
绘制单位 | 河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室、河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室、中国气象局气象干部培训学院河北分院、河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室、河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室 |
更多格式 | 高清、无水印(增值服务) |