本篇主要提供轻松学大数据挖掘电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
伴随着大数据时代的发展,数据价值的挖掘以及
产品化逐渐被重视起来。汪榕著的《轻松学大数据挖
掘:算法场景与数据产品》作为该领域的入门教程,
打破以往的数据工具与技术的介绍模式,凭借作者在
大数据价值探索过程中的所感所悟,以故事的形式和
读者分享一个又一个的数据经历,引人深思、耐人寻
味。全书共9章, ~2章介绍数据情怀与数据入门
;第3~6章讨论大数据挖掘相关的一系列学习体系;
第7~9章为实践应用与数据产品的介绍。让所有学习
大数据挖掘的朋友清楚如何落地,以及在整个数据生
态圈所需要扮演的角色,全面了解数据的上下游。
本书可作为相关工作经验在3年以内的数据挖掘
工程师、转型入门做大数据挖掘的人士或者对数据感
兴趣的追逐者的轻松学习教程,引导大家有一个正确
的学习方向,也可供对数据产品感兴趣的产品经理和
数据挖掘工程师阅读参考。
汪榕(@乐平汪二),一个充满大数据情怀的程序员,致力于分享自己的所感所悟,为数据生态圈的健康发展贡献自己一份力量。拥有6年的业务建模经验,曾率队夺得全国大学生数据建模一等奖,并代表重庆高校队伍与全国 名校一起参与深圳夏令营建模比赛。 目前从事互联网金融行业,专注于大数据挖掘与数据产品。同时也是大数据挖掘杂谈社区的创建人,汇集了 各地的数据爱好者,共同探索数据的价值。
第1章 数据情怀篇
1.1 数据之禅
1.2 数据情怀
1.2.1 数据情怀这股劲
1.2.2 对数据情怀的理解
1.3 大数据时代的我们
1.4 成为DT时代的先驱者
1.4.1 数据没有寒冬
1.4.2 数据生态问题
1.4.3 健康的数据生态
1.4.4 结尾
第2章 数据入门
2.1 快速掌握SQL的基础语法
2.1.1 初识SQL
2.1.2 学会部署环境
2.1.3 常用的SQL语法(上篇)
2.1.4 常用的SQL语法(下篇)
2.2 在Windows 7操作系统上搭建IPython Notebook
2.2.1 学习Python的初衷
2.2.2 搭建IPython Notebook
2.2.3 IPython.exe Notebook的使用说明
2.2.4 配置IPython Notebook远程调用
2.3 快速掌握Python的基本语法
2.4 用Python搭建数据分析体系
2.4.1 构建的初衷
2.4.2 构建思路
2.4.3 开发流程
2.5 Python学 结
2.5.1 关于Python
2.5.2 Python其他知识点
第3章 大数据工具篇
3.1 Hadoop伪分布式的安装配置
3.1.1 部署CentOS环境
3.1.2 部署Java环境
3.1.3 部署Hadoop伪分布式环境
3.2 数据挖掘中的MapReduce编程
3.2.1 学习MapReduce编程的目的
3.2.2 MapReduce的代码规范
3.2.3 简单的案例
3.3 利用MapReduce中的矩阵相乘
3.3.1 矩阵的概念
3.3.2 不同场景下的矩阵相乘
3.4 数据挖掘中的Hive技巧
3.4.1 面试心得
3.4.2 用Python执行HQL命令
3.4.3 必知的HQL知识
3.5 数据挖掘中的HBase技巧
3.5.1 知晓相关依赖包
3.5.2 从HBase中获取数据
3.5.3 往HBase中存储数据