《表2 不同程序在各数据集上的运行100次的时间(秒)》

《表2 不同程序在各数据集上的运行100次的时间(秒)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Python的K-means算法实现方式对比研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表2可以看出,在Python环境下,使用Numpy库实现K-means算法较传统编程方式时间优势明显,并且伴随着数据实例数和属性数的增加时间差距会进一步扩大,究其原因是Python语言是解释性语言,程序边编译边运行,运行效率较低,而Numpy库采用C语言编写,并且已经进行了编译,所以执行效率有数量级的提高。进一步研究可以发现,Numpy、Pandas等基于向量的运算方式也为大数据计算揭开了帷幕,使以深度神经网络为代表的深度学习异军突起,加速了图像识别、语音识别、自动翻译、自动驾驶等技术在各个方面的普及。