本书从基本的安装和配置Hadoop开始,解释了如何开发应用程序、维护系统,以及如何使用附加产品与来其他系统...
2014.1
本书以任务为导向,较为全面地介绍了Hadoop大数据技术的相关知识。全书共6章,具体内容包括Hadoop介绍、Had...
2018.1
本书是一本讲解Spark基础应用及编程的实用教程,基于Spark2.3版本,深入细致地介绍了:Spark与大数据、Spar...
2020.3
近年来,流处理变得越来越流行。作为高度创新的开源流处理器,Flink拥有诸多优势,包括容错性、高吞吐、低...
2018.9
Spark SQL是Spark生态环境中的最核心和最基础的组件,是掌握Spark的关键所在。本书以最新Spark版本,完全从...
2017.9
本书以Scala作为开发Spark应用程序的编程语言,系统介绍了Spark编程的基础知识。全书共8章,内容包括大数据...
2018.1
第1章绪论、第2章Linux操作系统的安装、第3章Hadoop的伪分布式安装、第4章Hadoop集群的搭建及配置、第5章Ha...
2020.1
本书是Hive的实战教材,介绍利用Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大...
2020.1
本书是关于大数据和Spark的实用手册。它将助你学习如何用Spark来完成很多大数据分析任务,其中覆盖了高效利...
2019.3
本书采用理论与实践相结合的方式,全面介绍了Hadoop大数据技术。主要内容包括初识Hadoop大数据技术、Hadoop...
2019.3