随着大数据需求和使用模式的扩大,Hadoop已暴露出诸多局限性,特别是越来越多的组织需要对大数据进行实时的、迭代式和交互式的分析和挖掘。本书将介绍如何用Spark这一被国内外广泛看好的明日之星,是如何超越Hadoop的这些局限性,以及如何在基于内存的分布式计算系统(Spark和Shark等)上实现突破。我们还将着重介绍英特尔中国使用Hadoop、Spark和Shark技术的开发实践,以及基于内存的实时大数据分析平台(包括数据的实时导入、分析和展现)的应用。

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。