《表3 常用聚类方法优缺点归纳》

《表3 常用聚类方法优缺点归纳》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《大数据匿名化隐私保护技术综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

聚类[31-32]是将数据集按照一定规则进行划分从而形成不同组,同一组中的对象彼此相似,它们构成一类,也称为簇,与其他组中的对象相异。当前广泛使用的聚类方法有5种:(1)基于层次的聚类(hierarchical methods)[33]。它是根据数据类之间相似程度,对不同的类采取合并或者分裂操作,直到完成所有数据集的聚类分配。具体又可分为“自底向上”和“自顶向下”两种方案。(2)基于划分的聚类(hierarchical methods)[34]。它与基于层次聚类的方法相似,不同之处在于基于划分的聚类以样本和类原型之间的距离为基础,给定一个有N个元组或者记录的数据集,采用分裂法构造K个组,每一个组就代表一个聚类,K