本书介绍了Spark应用程序及更高级应用的工作流程,主要从使用角度进行了描述,每个具体内容都有对应的代码。本书涵盖了ApacheSpark和它丰富的API,构成Spark的组件(包括SparkSQL、SparkStreaming、SparkMLlib和SparkGraphX),在Sparkstandalone、HadoopYARN以及Mesosclusters上运行Spark应用程序的部署和安装。通过对应的实例全面、详细地介绍了整个Spark实战开发的流程。*后,还介绍了Spark的高级应用,包括Spark流应用程序及可扩展和快速的机器学习框架H2O。 本书可以作为高等院校计算机、软件工程、数据科学与大数据技术等专业的大数据课程材料,可用于指导Spark编程实践,也可供相关技术人员参考使用。

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。