本书分两部分,共8章,介绍了如何使用开源工具和技术开发与实现大规模分布式处理系统,涵盖构建高性能分布式计算系统的方法和最佳实践。第一部分(第1-4章)介绍了高性能分布式计算编程的基础知识,包括分布式系统、Hadoop入门、Spark入门、Scalding入门等;第二部分(第5-8章)给出了使用Hadoop、Spark、Scalding的案例研究,涉及数据聚类、数据分类、回归分析、推荐系统等。

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。