本书介绍了Spark应用程序及更高级应用的工作流程,主要从使用角度进行了描述,每个具体内容都有对应的代码。本书涵盖了Apache Spark和它丰富的API、构成Spark的组件(包Spark SQL、Spark Streaming、Spark MLlib和Spark GraphX)、在Spark standalone、 Hadoop YARN以及Mesos clusters上运行Spark应用程序的部署和安装。通过对应的实例全面、详细介绍了整个Spark实战开发的流程。最后,还介绍了Spark的高级应用:Spark流应用程序及可扩展和快速的机器学习框架H2O。