本篇主要提供Hadoop大数据平台集群部署与开发罗文浪,邱波,郭炳宇,姜善永电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
本教材一共6个项目,项目1为Hadoop导入,主要 介绍了Hadoop的作用、特点、发展情况,并详细介绍 了Hadoop伪分布式搭建及使用方法;项目2主要对 Hadoop的核心元素、接口操作进行了细致讲解;项目3 对为实现Hadoop HA所需的Zookeeper的架构、部署等 进行了解释;项目4至项目6详细介绍了Hadoop生态圈 中的几个核心组件——分布式存储数据库(HBase)、 数据迁移神器(Sqoop)、数据采集神器(Flume)以 及数据仓库(Hive),在介绍这几个核心组件的同时 也融入了对于大数据综合实验的分析。本教材具有较 强实用性,教材内容以“学”和“导学”交织呈现, 十分适合学习者使用。
任务一:Hadoop简介
1.1.1 Hadoop介绍
1.1.2 Hadoop的发展历史及现状
1.1.3 任务回顾
1.2 任务二:搭建Hadoop伪分布式环境
1.2.1 准备工作
1.2.2 伪分布式环境搭建
1.2.3 Hadoop测试
1.2.4 任务回顾
1.3 项目总结
1.4 拓展训练
项目2:Hadoop入门及实战
2.1 任务一:HDFS体系结构与基本原理
2.1.1 HDFS概述
2.1.2 HDFS核心元素及其原理
2.1.3 任务回顾
2.2 任务二:HDFS接口操作
2.2.1 Shell接口操作
2.2.2 Java接口操作
2.2.3 任务回顾
2.3 任务三:MapReduce开发实战
2.3.1 MapReduce工作机制
2.3.2 MapReduce开发实战
2.3.3 任务回顾
2.4 项目总结
2.5 拓展训练
项目3:搭建Zookeeper运行环境
3.1 任务一:Zookeeper概述
3.1.1 Zookeeper原理
3.1.2 Zookeeper系统架构
3.1.3 任务回顾
3.2 任务二:ZooKeeper集群搭建
3.2.1 集群规划
3.2.2 安装zookeeper集群
3.2.3 任务回顾
3.3 任务三:使用Zookeeper来实现Hadoop的高可用性
3.3.1 Zookeeper集群与Hadoop高可用性
3.3.2 Hadoop高可用性集群部署
3.3.3 任务回顾
3.4 项目总结
3.5 拓展训练
项目4:分布式存储数据库
4.1 任务一:HBase概述
4.1.1 HBase简介
4.1.2 HBase表结构
4.1.3 HBase核心进程
4.1.4 HBase系统架构
4.1.5 任务回顾
4.2 任务二:HBase集群搭部署
4.2.1 HBase单节点部署