本篇主要提供数据分析与大数据实践电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
本书 章介绍了大数
据的基本概念,同时在尽量
回避复杂公式的基础上,介
绍了与大数据密切相关的信
息论和统计学中的 重要的
概念,包括信息的度量和信
息熵、信息的编码、信息的
有效性和等价性、信息的冗
余和压缩,以及信息的相关
性、贝叶斯公式等。第二章
介绍用网络爬虫获取网络数
据的方法。第三章介绍大数
据加工的基本流程:数据清
洗、数据转换、数据脱敏、
数据集成、数据集合和数据
归约。第四章介绍用Excel
和Tableau进行数据处理、
时间序列分析、回归分析和
聚类分析等技术。第五章介
绍利用Excel、Power BI和
Tableau等数据分析和可视
化领域中处于领头羊位置的
三大软件进行数据分析和可
视化的方法。第六章介绍了
数据安全的概念和发布数据
可视化结果的方案。第七章
,我们特邀了富有教学和工
程经验的Tableau公司的高
级顾问撰写了精彩的数据分
析和可视化综合实战案例。
本书适合高等学校文、史、
哲、法、教等文科专业,以
及金融、统计、管理类商科
专业学生,作为计算机应用
课程的教材使用;也可以供
各类社会计算机应用人员由
浅入深、逐层递进地掌握数
据分析和大数据应用的
技巧;也可供准备参加数据
分析与管理类计算机等级考
试人员作为参考书使用。
第1章 大数据与信息论简介
本章概要
学习目标
1.1 大数据基本概念
1.1.1 大数据的定义
1.1.2 大数据的特点
1.1.3 大数据的研究目标
1.2 大数据支撑技术简介
1.2.1 统计学简介
1.2.2 机器学习简介
1.2.3 数据可视化简介
1.2.4 大数据分析与计算工具
1.2.5 数据资源简介
1.3 信息论简介
1.3.1 信息的度量和信息熵
1.3.2 信息的编码
1.3.3 信息的有效性和哈夫曼编码
1.3.4 信息的冗余和压缩
1.3.5 信息的相关性
1.3.6 贝叶斯公式与因果关系
1.4 综合练习
1.4.1 选择题
1.4.2 填空题
1.4.3 综合实践
第2章 数据获取
本章概要
学习目标
2.1 数据获取概述
2.1.1 数据获取的来源
2.1.2 数据获取的方法
2.1.3 数据源和数据集
2.2 常用数据集的获取
2.2.1 常用的数据集
2.2.2 使用Python的sklearn提供的数据集
2.2.3 使用R语言提供的数据集
2.3 网页信息爬取
2.3.1 网络爬虫概述
2.3.2 HTTP基本原理
2.3.3 网页的基本结构
2.3.4 Python相关库
2.3.5 使用requests和re爬取猫眼电影 00榜单
2.3.6 使用requests和bs4爬取豆瓣电影TOP 250榜单
2.4 综合练习
2.4.1 选择题
2.4.2 填空题
2.4.3 简答题
2.4.4 实践题
第3章 数据加工
本章概要
学习目标