《大数据教程:大数据技术与编程基础:bigdatadeveloperprog计算机与互联》[42M]百度网盘|pdf下载|亲测有效
《大数据教程:大数据技术与编程基础:bigdatadeveloperprog计算机与互联》[42M]百度网盘|pdf下载|亲测有效

大数据教程:大数据技术与编程基础:bigdatadeveloperprog计算机与互联 pdf下载

出版社 青草书店专营店
出版年 2018-10
页数 390页
装帧 精装
评分 9.3(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供大数据教程:大数据技术与编程基础:bigdatadeveloperprog计算机与互联电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

  商品基本信息,请以下列介绍为准
商品名称:大数据*教程:大数据技术与编程基础:big data developer prog 计算机与互联网 WroxIT认证项目组编 人民邮电出版社 9787115493507
作者:WroxIT认证项目组编
定价:109.0
出版社:人民邮电出版社
出版日期:2018-10-01
ISBN:9787115493507
印次:
版次:01
装帧:
开本:小16开

  内容简介
“大数据*年成为IT领域的热点话题,人们每天都会通过互联网、移动设备等产生大量数据。如何管理大数据、掌握大数据的核心技术、理解大数据相关的生态系统等,是作为大数据*须学*练掌握的。本系列书以“大数据*”应掌握的技术为主线,共分两卷,以7个模块分别介绍如何管理大数据生态系统、如何存储和处理数据、如何利用Hadoop工具、如何利用NoSQL与Hadoop协同工作,以及如何利用Hadoop商业发行版和管理工具。本系列书涵盖了大数据开发工作的核心内容,全面且详尽地涵盖了大数据开发的各个领域。
本书为第1卷,共4个模块,分别介绍大数据基础知识、大数据生态系统的管理、HDFS和MapReduce以及Hadoop工具(如Hive、Pig和Oozie等)。本书适用于想成为大数据*以及所有对大数据开发感兴趣的技术人员和决策者阅读。

  目录
模块1 大数据入门
第 1讲 大数据简介 3
1.1 什么是大数据 4
1.1.1 大数据的优势 5
1.1.2 挖掘各种大数据源 6
1.2 数据管理的历史——大数据的演化 7
1.3 大数据的结构化 9
1.4 大数据要素 13
1.4.1 数据量 13
1.4.2 速度 14
1.4.3 多样性 14
1.5 大数据在商务环境中的应用 14
1.6 大数据行业中的职业机会 16
1.6.1 职业机会 17
1.6.2 所需技能 17
1.6.3 大数据的未来 19
练*0
备忘单 22
第 2讲 大数据在商业上的应用 23
2.1 社交网络数据的重要性 24
2.2 金融欺诈和大数据 30
2.3 保险业的欺诈检测 32
2.4 在业中应用大数据 36
练*0
备忘单 42
第3讲 处理大数据的技术 43
3.1 大数据的分布式和并行计算 44
3.1.1 并行计算技术 46
3.1.2 虚拟化及其对大数据的重要性 47
3.2 Hadoop简介 47
3.3 云计算和大数据 50
3.3.1 大数据计算的特性 50
3.3.2 云部署模型 51
3.3.3 云交付模型 52
3.3.4 大数据云 52
3.3.5 大数据云市场*应商 53
3.3.6 使用云服务所存在的问题 54
3.4 大数据内存计算技术 54
练*6
备忘单 58
第4讲 了解Hadoop生态系统 59
4.1 Hadoop生态系统 60
4.2 用HDFS存储数据 61
4.2.1 HDFS架构 62
4.2.2 HDFS的一些*能 65
4.3 利用Hadoop MapReduce处理数据 65
4.3.1 MapReduce是如何工作的 66
4.3.2 MapReduce的优点和缺点 66
4.3.3 利用Hadoop YARN管理资源和应用 67
4.4 利用HBase存储数据 68
4.5 使用Hive查询大型数据库 69
4.6 与Hadoop生态系统的交互 70
4.6.1 Pig和Pig Latin 70
4.6.2 Sqoop 71
4.6.3 Zookeeper 72
4.6.4 Flume 72
4.6.5 Oozie 73
练*4
备忘单 76
第5讲 MapReduce基础 77
5.1 MapReduce的起源 78
5.2 MapReduce是如何工作的 79
5.3 MapReduce作业的优化技术 85
5.3.1 硬件/网络拓扑 85
5.3.2 同步 86
5.3.3 文件系统 86
5.4 MapReduce的应用 86
5.5 HBase在大数据处理中的角色 87
5.6 利用Hive挖掘大数据 89
练*1
备忘单 94
模块2 管理大数据生态系统
第 1讲 大数据技术基础 97
1.1 探索大数据栈 98
1.2 冗余物理基础设施层 99
1.2.1 物理冗余网络 100
1.2.2 管理硬件:存储和服务器 101
1.2.3 基础设施的作 101
1.3 基础设施层 101
1.4 接口层以及与应用程序和互联网的双向反馈 102
1.5 可作数据库层 103
1.6 组织数据服务层及工具 104
1.7 分析数据仓库层 105
1.8 分析层 105
1.9 大数据应用层 106
1.10 虚拟化和大数据 107
1.11 虚拟化方法 108
1.11.1 服务器虚拟化 109
1.11.2 应用程序虚拟化 109
1.11.3 网络虚拟化 110
1.11.4 处理器和内存虚拟化 110
1.11.5 数据和存储虚拟化 111
1.11.6 用管理程*行虚拟化管理 111
1.11.7 抽象与虚拟化 112
1.11.8 实施虚拟化来处理大数据 112
练*14
备忘单 116
第 2讲 大数据管理系统——数据库和数据仓库 117
2.1 RDBMS和大数据环境 118
2.2 非关系型数据库 119
2.2.1 键值数据库 120
2.2.2 

  编辑
学*和 涵盖了大数据*所需的大数据和Hadoop 基础组件及相关组件的基本知识,使参与者有可能在一个系列书中获得对所有相关知识、新兴技术*台的了解。 在与大数据架构、大数据应用程序开发以及与大数据实施相关的产业相关技术有着极密切关联的编程和技术领域中,锻炼自己全面的和结构化的本领。 基于场景的学*,通过多种有代表性的现实场景的使用和案例研究,将IT 基础知识融入现实环境,鼓励参与者积极、全面地学*究,实现体验式教学。 强调目标明确、基于成果的学*一讲都以“本讲目标”开始,该目标*一步关联整个教程的更广泛的目标。 简明、循序*的编程和编码指导,清晰地解释每行代码的基本原理。 强调、实用的过程和技术,帮助参与者深入理解巧妙且符合道德伦理的专业实践及其对业务的影响。 大数据是当今科技行业的流行语之一。全的企业都已经意识到可用的大量数据的价值,并尽努力来管理和分析数据、发挥其作用,以建立战略和发展竞争优势。与此同时,这项技术的出现,导致了各种新的和增强的工作角色的演变。 “大数据*教程”系列的目标是培养新一代的化大数据程序员、*和技术专家,使其熟悉大数据的相关工具*台和架构,帮助企业有效地存储、管理并处理海量和多样的数据。同时,本书还有助于读者了解如何有效地整合、实现、定制和管理大数据基础架构。 本系列旨在为读者提供处理大数据的技术、存储、处理、管理和基础架构方面的技能,丰富读者与Hadoop 及其组件工具协同工作的经验,并使其可以开发MapReduce 和Pig 程序,纵分布式文件,以及了解支持MapReduce 程序的API 等。读者同时可以熟悉*行的Hadoop 商业发行版系统,如Cloudera、Hortonworks 和Greenplum 等。*后通过一个完整的项目介绍,使读者能够开发一个集成的大数据应用程序。 本系列共两卷,第1 卷“大数据技术与编程基础*含4 个模块,涉及大数据入门,管理大数据生态系统,使用HDFS 和MapReduce 存储和处理数据,利用Hadoop 工具(如Hive、Pig 和Oozie 等)提升效率;第2 卷“NoSQL、Hadoop 组件及大数据实施*含3 个模块,涉及ZooKeeper、Sqoop、Flume、YARN 和Storm 等额外的Hadoop 工具,如何利用NoSQL 和Hadoop 实现实时、和云,以及Hadoop 商业发行版和管理工具简介。