本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
图书基本信息 | |
图书名称 | 大数据技术基础 |
作者 | 薛志东 著 |
定价 | 55元 |
出版社 | 人民邮电出版社 |
ISBN | 9787115483072 |
出版日期 | 2018-08-01 |
字数 | |
页码 | |
版次 | |
装帧 | 平装 |
开本 | 16开 |
商品重量 |
内容提要 | |
本书系统、全面地介绍了大数据技术的基础知识,期望学生通过对本书的学习和实践了解大数据技术的概貌,掌握Hadoop生态圈大数据技术中为基础和关键的知识。主要内容包括大数据概述、大数据软件技术基础、大数据存储技术、MapReduce分布式编程、数据采集与预处理、数据仓库与联机分析技术、数据挖掘与分析技术、Spark分布式内存计算框架、数据可视化技术、大数据安全。 |
目录 | |
章 大数据概述 1.1 大数据的相关概念 1.2 大数据处理的基础技术 1.2.1 大数据处理流程 1.2.2 分布式计算 1.2.3 分布式文件系统 1.2.4 分布式数据库 1.2.5 数据库与数据仓库 1.2.6 云计算与虚拟化技术 1.2.7 虚拟化产品介绍 1.3 流行的大数据技术 1.4 大数据解决方案 1.5 大数据发展现状和趋势 1.5.1 大数据现状分析 1.5.2 大数据发展趋势 1.6 教学建议及教辅资料 习题 第2章 大数据软件基础 2.1 Linux基础 2.1.1 Linux简介 2.1.2 Linux基本操作 2.1.3 网络配置管理 2.1.4 其他常用网络命令 2.2 Java基础 2.2.1 面向对象与泛型 2.2.2 集合类 2.2.3 内部类与匿名类 2.2.4 反射 2.3 SQL语言基础 2.4 在VirtualBox上安装Linux集群 2.4.1 master节点的安装 2.4.2 配置Virtualbox网络及虚拟机 网卡 2.4.3 slave节点的安装与配置 2.4.4 Java环境的安装 2.4.5 MySQL服务 2.4.6 SSH免密钥登录 2.4.7 配置时钟同步 习题 第3章 大数据存储技术 3.1 理解HDFS分布式文件系统 3.1.1 HDFS简介 3.1.2 HDFS的体系结构 3.1.3 HDFS中的数据流 3.2 NoSQL数据库 3.2.1 键值数据库Redis 3.2.2 列存储数据库HBase 3.2.3 文档数据库MongoDB 3.2.4 图数据库Neo4j 3.3 Hadoop的安装与配置 3.3.1 Hadoop的配置部署 3.3.2 启动Hadoop集群 3.4 HDFS文件管理 3.4.1 命令行访问HDFS 3.4.2 使用JavaAPI访问HDFS 3.5 HBase的安装与配置 3.5.1 解压并安装HBase 3.5.2 配置HBase 3.6 HBase的使用 3.6.1 HBase-shell 3.6.2 JavaAPI 习题 第4章 MapReduce分布式编程 第5章 数据采集与预处理 第6章 数据仓库与联机分析处理 第7章 大数据分析与挖掘技术 第8章 Spark分布式内存计算框架 第9章 数据可视化技术 0章 大数据安全 |
作者介绍 | |
薛志东,博士,研究员,现任华中科技大学软件学院大数据研究室主任。1997年7月于原华中理工大学获学士学位;2002年6月于华中科技大学计算机应用专业获硕士学位;2006年6月于华中科技大学系统分析与集成专业获博士学位;2006年9月于华中科技大学计算机科学与技术博士后流动站开展研究工作。在图像处理及生物信息学领域发表论文10余篇,曾承担国家自然科学 |
编辑推荐 | |
1.本书为高等学校计算机类专业教学指导委员会-华为ICT产学结合项目的成果n 2.提供系统完整的数据科学与大数据专业解决方案n 3.名校名师打造大数据领域精品力作n 4.全面介绍大数据技术概况n 5.讲解Hadoop生态圈平台、工具与技术 |