《表2 Dist概率示例:基于k-d树分区的聚类算法并行加速策略》
假设某个数据集含有9个数据样本{x1,x2,…,x8,x9},现已选出两个质心{c1,c2}且假设c1=x1、c2=x2,则剩下的质心需从剩余的7个数据样本中选择。根据选取初始质心的步骤(2),首先计算剩余数据样本集{x3,…,x8,x9}中每个数据样本与已选质心c1、c2间的距离Dist(xi,cj)与MinDist(di,cj),具体见表1;然后计算每个样MinDist(di,cj)的占比p(Dist(xi,cj)),并采用转盘轮转发选择第三个质心,p(Dist(xi,cj))的计算值见表2。
图表编号 | XD006909300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.16 |
作者 | 汪丽娟、钱育蓉、侯海耀、张晗、赵京霞、赵燚 |
绘制单位 | 新疆大学软件学院、新疆大学软件学院、新疆大学软件学院、新疆大学软件学院、新疆大学软件学院、新疆大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |