《表1 主流数据库优缺点对比》

《表1 主流数据库优缺点对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《大数据在社会科学领域的应用探讨——基于POI大数据的案例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:根据百度百科对各数据库的论述总结归纳。

随着信息化、网络化、智能化及物联化的深入发展,各领域每时每刻都在产生大量数据,有别于传统的数据,大数据具有5V(Volume、Velocity、Variety、Value、Veracity)特点[1],即数据量大、数据生成及处理速度快、数据类型多样、价值密度较低、数据准确和可信赖。近年来,大数据已经引起了国内外学者的广泛关注和研究,在迈尔-舍恩伯格和库克耶合著的《“大数据”时代:生活、工作与思维方式的大变革》中指出大数据正在深刻改变经济生活的各领域[2],这本论著掀起了国内外大数据研究热潮并成为许多学科的热点与主流[3][4][5],朱建平对大数据的分析理念进行了深入辨析[6],张庆熊(2015)、李天柱(2018)、周良发(2018)等学者则专门讨论了大数据在人文社会科学领域的应用及发展趋势[7][8][9][10]。随着网络地图服务的快速兴起和普及,POI这种具有地理坐标度信息的数据逐渐成为一种社科研究的重要数据类型。POI数据是人口、土地、经济、社会等城市主要要素相互作用的综合体现,集地理位置信息和功能分类信息于一体,与传统数据相比较还具有规模大、覆盖广、类别多、易获取、更新速度快等优点,越来越得到用户认可和青睐,也日益引起研究人员的重视[11][12][13]。与传统基于城市用地类型划分的城市功能结构研究不同,通过POI数据识别和分析复杂多变的城市功能空间结构可大量节省实地调研的时间,而且能够从宏观、中观及微观多种尺度对城市空间结构开展分析,使得研究结果也显得更为精细。一般而言,一个城市的POI数据类型多样而且数量非常庞大,以广州为例,根据从高德地图抓取的POI数据量达到128万条(数据抓取时间为2017年7月份),常用的Excel、Access、Stata、SPSS等软件难以直接处理这么大量的数据,必须借助数据库进行存储和处理。对于大部分科研人员而言,免费而且功能足够的强大的开源数据库成为必然选择,常用的开源数据软件主要包括MySQL、PostgreSQL、SQLite等,与商业数据库相比还有一些差距(见表1)。本文以粤港澳大湾区的496万个POI数据的存储与分析处理为例,结合PostgreSQL开源数据库探讨社会科学大数据的处理与应用方法,同时采用空间核密度方法分析粤港澳大湾区城市空间结构现状并总结其特征。