《表4 混合型数据集描述:一种面向混合型数据聚类的k-prototypes聚类算法》

《表4 混合型数据集描述:一种面向混合型数据聚类的k-prototypes聚类算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种面向混合型数据聚类的k-prototypes聚类算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

算法用Python语言实现,所有实验均在intel(R)Core(TM)处理器i7-8700K [email protected],Windows10操作系统上运行.使用数据集均来自UC机器学习数据库.UCI1是加州大学欧文分校提供的专门用于机器学习的真实数据集.为了验证提出算法的有效性和可行性,论文从UCI数据集中选取Bank Marking(简称Bank),Zoo两个混合型数据集进行实验验证.选取这两个数据集作为实验数据集主要是因为混合型数据集有比纯分类型数据集和纯数值型数据集更高的复杂性.因此不可以单一的、随机的选取数据集以验证算法的有效性.选取Bank数据集做为实验数据集主要原因是为了验证在分类型和数值型特征分布均匀的情况下KPMD算法的有效性.Bank数据集的特征分布比较特殊,其分类型和数值型数据特征的个数完全一样;选取Zoo数据集做为实验数据集主要原因是为了验证在分类型和数值型特征分布不均匀的情况下KPMD算法的有效性.Zoo数据集的特征分布比较特殊,其分类型和数值型数据特征的个数差别非常大.此外,选取这两个数据集作为实验数据集的另一个原因是为了验证在数据集簇数较少和较多的情况下,KPMD算法的有效性.所选数据集的详细信息如表4所示.