《表1 四个科学范式(来源:Kitchin,2014)》

《表1 四个科学范式(来源:Kitchin,2014)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《大数据科学的因果解释性理论难题刍议》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

数据太多并非大数据的真正的认识论问题,因此,解决方案不是用越来越多的技巧或技术将其缩小到可管理的规模,而是要形成对大数据分析方法的哲学研究。传统上,分析师通过对技术和数据知识的先前选择的适当方法研究相关数据来测试理论;现在,可以将数百种不同的算法应用于数据集,以确定最佳复合模型或解释,寻求获得“来之于数据”的见解[7]。因此,大数据分析被认为是能够实现完全不同的认识论方法来理解世界。回到2007年,这种新的认识论方法使吉姆·格雷(Jim Gray)认为我们正在目睹他所谓的eScience的出现,一个“科学新的第四范式”,继承和统一了经验的、理论的和计算的范式[8](表1)。他呼吁一个新的以数据集约科学力量为基础的科学方法。它用来补充而不是取代,第一(经验/实验),第二(分析/理论)以及第三(大规模计算机模拟)科学“范式”。四个“范式”的共存说明它们不是库恩式的范式。在科学研究中,最初只有实验科学,几千年以前,科学以实验为主描述自然现象;接着有了理论科学,过去数百年,科学出现了理论研究分支,利用模型和归纳,有了开普勒定律、牛顿运动定律、麦克斯韦方程式等;然后,过去数十年,科学出现了计算分支,对于复杂现象进行仿真,对于许多问题,用这些理论模型来分析解决变得太复杂,人们只好进行模拟,这些模拟方法已经引领我们走过了20世纪下半叶的几乎全部时间;今天,数据爆炸(eScience)将理论、实验和计算仿真统一起来。新的研究模式是通过一起收集数据或通过模拟方法产生数据,然后用软件进行处理,再将形成的信息和知识存储于计算机中。科学家通过数据管理和统计方法分析数据和文档。