本书中从大数据系统指引开始,陆续介绍了NoSQL、分布式计算和CAP理论。在介绍使用Hadoop和Hive分析大数据之后,又覆盖了使用BigQuery进行实时分析。还有高级课题包括MapReduce流水线、Pig和Cascading、使用Mahout进行机器学习。最后,你会看到将Python和R整合到大数据工具链中的例子。有很多例子贯穿这些章节始终,帮助你学习和使用这些工具。所有这些内容结合在一起,组成了一本完美的书,读罢可以对大数据分析有一个广泛的了解。

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。