大数据是一把双刃剑,给统计学科的发展既带来机遇又提出挑战,本文正是基于此进行讨论。在大数据背景下,首先根据大数据流的形式和特征,提出了在大数据时代抽样调查仍有存在意义的观点;其次确立大数据的分析逻辑体系,将对大数据流的统计分析问题定义为“推断灾难”体系,由“维度问题”和“结构问题”构成,其中对“维度问题”的含义和解决方法进行了归纳和总结,对于“结构问题”,本文根据大数据的特性,将大数据信息看作是真实数据和虚假信息的汇总,构建了大数据下的结构模型,并通过数理证明得到了大数据下模型参数估计会减小的结论;再次面对大数据的结构问题时,作者提出了两种解决思路,通过模拟分析,验证了这两种方法在处理大数据问题时的有效性;最后由于大数据具有多元数据流的特性,使得对同一变量有不同的观察值,而使用哪个值来估计会产生问题,本文依照因子分析的逻辑展开讨论,建立了多元大数据流模型,并推导出真实变量的估计方程。本文作为一种尝试,从统计分析的角度入手,望能扩展大数据的研究视野。

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。