描述

开本: 16开纸张: 胶版纸包装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787121370519

产品特色

编辑推荐

过程完整：从基础配置过程一直到真正的商业项目开发
例子丰富：90个“实例”，1 个完整项目
原理清晰：重点概念、操作、思路都有图示，避免抽象理解
代码详尽：所有实例都有详细的代码，所有代码都有详尽的解读
知识点新：包含Structured Streaming详解
阅读感好：采用短段、短句，可以流畅阅读
辐射面广：讲解了Spark与周边框架的交互
服务完善：读者可加入本书QQ学习群在线交流

内容简介

本书基于Spark 2.3.x、Spark 2.4.x系列版本

采用“理论实践”的形式编写。全书共有90个实例，1个完整项目。

第1篇“准备”，包括认识大数据和Spark、安装与配置Spark集群、第1个Spark程序；

第2篇“入门”，包括读写分布式数据、处理分布式数据；

第3篇“进阶”，包括RDD的高级操作、用SQL语法分析结构化数据、实时处理流式数据；

第4篇“高阶”，包括实时处理流式数据、Spark的相关优化；

第5篇“商业项目实战”，用Spark的各种组件实现一个学生学情分析商业项目。

本书结构清晰、实例丰富、通俗易懂、实用性强，特别适合Spark的初学者和进阶读者作为自学用书。另外，本书也适合社会培训学校作为培训教材，还适合大中专院校的相关专业作为教学参考书。

作者简介

刘景泽
全栈工程师，长期从事大数据的研发工作，拥有丰富的大数据开发经验。
曾担任多家知名企的主力研发，并负责大数据云服务组件开发。
精通Java、Scala、Python等多种编程语言，擅长大数据生态圈的研发、算法、逆向工程等技术。
为多家企业提供技术支持，并长期面向企业一线开发人员分享实战经验。

目　　录