本书以“理论-实践操作”相结合的方式深入的讲解了大数据分析的基本知识和实现的基本技术,在内容设计上既有上课时老师的讲述部分,包括详细的理论与典型的案例;又有大量的实训环节,双管齐下,极大的激发了学生在课堂上的学习积极性与主动创造性,让学生在课堂上跟上老师的思维,从而学到更多有用的知识和技能。
本书介绍了大数据可视化的基础,大数据可视化的实现方法,并对Python数据可视化作了详细的描述。 特色:
1.结构体例:使用案例教学为主,每一章有案例的导入及完整的分析,理论与实践相结合。
2.写作特点:本书逻辑清楚,语言平易近人。
3.加入了z新的Python库实现大数据可视化,具有开拓性与创新性。
4.教师有丰富的上课经验和教改课题的经验,教学案例丰富。
5.本书配有大量重难点视频,以帮助学生课后自习。
1、工作及教育背景 黄源,男,计算机专业研究生,研究方向为计算机软件与理论,2003年至今在重庆航天职业技术学院计算机系担任专职教师,副教授,主要教授计算机网络、计算机软件等专业的专业课程。 3、著作 (1)XML基础与案例教程 机械工业出版社 2018年2月出版(第一主编) (2)HTML+CSS3网页设计 机械工业出版社 2018年4月出版(第一主编)
第1章大数据可视化概述1.1大数据可视化基础1.1.1什么是大数据可视化1.1.2数据可视化的类型1.1.3数据可视化的标准1.1.4数据可视化与其他学科的关系1.1.5数据可视化面临的挑战1.2数据可视化的目标与作用1.2.1数据可视化的目标1.2.2数据可视化的作用1.3数据可视化技术的特征与应用1.3.1数据可视化技术的特征1.3.2数据可视化技术的应用1.4本章小结1.5实训习题1第2章大数据可视化原理2.1光与视觉特性2.1.1光2.1.2人眼的构造和视觉特性2.2色彩2.2.1色彩的概念和分类2.2.2色彩给人的视觉感受2.3视觉通道2.3.1视觉通道概述2.3.2视觉通道的类型2.3.3视觉通道与视觉原理2.4数据可视化流程2.4.1数据可视化流程简介2.4.2数据可视化流程的实施步骤2.5数据可视化设计原则与技巧2.5.1数据可视化设计原则概述2.5.2数据可视化设计原则的实施2.5.3数据可视化设计技巧2.6本章小结2.7实训习题2第3章大数据可视化方法3.1可视化图介绍3.1.1统计图表介绍3.1.2数据功能图表介绍3.1.3可视化图表的选择与使用技巧3.2文本可视化3.2.1文本可视化概述3.2.2词云概述及实现方法3.3网络可视化3.3.1网络可视化概述3.3.2使用Python 3制作社交网络图3.4空间信息可视化3.4.1空间信息可视化概述3.4.2空间信息可视化建模3.4.3空间信息可视化的应用3.5本章小结3.6实训习题3第4章数据可视化工具4.1Excel4.1.1Excel简介4.1.2Excel的应用4.2ECharts4.2.1ECharts简介4.2.2ECharts的应用4.3Tableau4.3.1Tableau简介4.3.2Tableau的应用4.4魔镜4.4.1魔镜简介4.4.2魔镜的应用4.5D3.js4.5.1D3.js简介4.5.2D3.js的应用4.6可视化开发语言4.7本章小结4.8实训习题4第5章Excel数据可视化5.1Excel函数与图表5.1.1Excel函数5.1.2Excel图表5.2Excel数据源5.2.1从外部导入数据5.2.2随机产生数据5.3Excel可视化应用5.3.1直方图5.3.2折线图5.3.3饼图5.3.4XY散点图5.3.5箱形图5.4本章小结5.5实训习题5第6章Tableau数据可视化6.1Tableau和Tableau界面6.1.1Tableau介绍6.1.2Tableau界面介绍6.2利用Tableau实现可视化6.2.1数据的导入及展示6.2.2筛选器6.2.3保存工作表6.3Tableau数据分析6.3.1“分析”窗格介绍6.3.2Tableau数据分析的实现6.4本章小结6.5实训习题6第7章ECharts与pyecharts数据可视化7.1ECharts的下载与使用7.1.1ECharts的下载7.1.2ECharts使用基础7.1.3ECharts使用实例7.2ECharts可视化应用7.3pyecharts可视化应用7.4本章小结7.5实训习题7第8章Python数据可视化8.1Python可视化库8.1.1Python可视化库简介8.1.2Python可视化库的安装与使用8.2NumPy库8.3基于matplotlib的数据可视化8.3.1matplotlib.pyplot库简介8.3.2matplotlib可视化8.4基于Pandas的数据可视化8.4.1Pandas绘图介绍8.4.2Pandas绘图实例8.5基于Seaborn的数据可视化8.5.1Seaborn绘图介绍8.5.2Seaborn绘图实例8.6基于Bokeh的数据可视化8.6.1Bokeh绘图介绍8.6.2Bokeh绘图实例8.7基于pyqtgraph的数据可视化8.7.1pyqtgraph绘图介绍8.7.2pyqtgraph绘图实例8.7.3pyqtgraph内置绘图库8.8本章小结8.9实训习题8第9章大数据可视化行业分析9.1旅游业大数据可视化分析9.1.1旅游业大数据介绍9.1.2旅游业大数据可视化分析实例9.1.3旅游业大数据可视化实例9.2电商业大数据可视化分析9.2.1电商业大数据介绍9.2.2电商业大数据可视化分析实例9.3教育业大数据可视化分析9.3.1教育业大数据介绍9.3.2教育业大数据可视化分析实例9.4本章小结9.5实训习题9第10章大数据可视化综合实训10.1Python纵向柱状图实训10.2Python水平柱状图实训10.3Python多数据并列柱状图实训10.4Python折线图实训10.5Python散点图实训10.6本章小结习题10
第3章大数据可视化方法本章学习目标 了解可视化图的分类。 了解统计图表的分类。 了解文本可视化的概念和流程。 掌握词云的实现。 了解网络可视化的概念。 掌握社交网络图的实现。 了解空间信息可视化的概念。本章先向读者介绍大数据可视化图的分类,再介绍文本可视化的概念和流程,接着介绍词云的制作及社交网络图的实现,最后介绍空间信息可视化的概念。视频讲解3.1可视化图介绍3.1.1统计图表介绍图是表达数据最直观、最强大的方式之一,通过图的展示能够对数据进行优雅的变换,从而让枯燥的数字能吸引人们的注意力。在实现数据可视化选择图时应当首先考虑的问题是有什么数据,需要用图做什么,该如何展示数据。在统计图表的每一种类型的图表中都可包含不同的数据可视化图形,例如柱状图、饼图、气泡图、热力图、散点图、直方图、雷达图、环形图、漏斗图、和弦图、仪表盘图、面积图、折线图、密度图以及K线图等。1. 柱状图柱状图使用垂直或水平的柱子显示类别之间的数值比较。在柱状图中一个轴表示需要对比的分类维度,另一个轴代表相应的数值。柱状图又可分为纵向柱状图和横向(或水平)柱状图。图31显示了纵向柱状图; 图32显示了横向柱状图。图31纵向柱状图图32横向柱状图 2. K线图K线图又称阴阳图、棒线、红黑线或蜡烛线,常用于展示股票交易数据。K线就是指将各种股票每日、每周、每月的开盘价、收盘价、最高价、最低价等涨跌变化状况用图形的方式表现出来。图33显示了K线图。图33K线图3. 饼图饼图用于表示不同分类的占比情况,通过弧度大小来对比各种分类。饼图通过将一个圆饼按照分类的占比划分成多个区块,整个圆饼代表数据的总量,每个区块(圆弧)表示该分类占总体的比例大小,所有区块(圆弧)的和等于100%。图34显示了饼图。4. 折线图图34饼图折线图用于显示数据在一个连续的时间间隔或者时间跨度上的变化,它的特点是反映事物随时间或有序类别变化的趋势。在折线图中,数据是递增还是递减、增减的速率、增减的规律(周期性、螺旋性等)、峰值等特征都可以清晰地反映出来。图35显示了折线图。5. 散点图散点图是指在回归分析中数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。图36显示了散点图。图35折线图图36散点图6. 气泡图气泡图是一种多变量图表,是散点图的变体,也可以认为是散点图和百分比区域图的组合。图37显示了气泡图。图37气泡图7. 雷达图雷达图又叫戴布拉图、蜘蛛网图。传统的雷达图被认为是一种表现多维(4维以上)数据的图表。它将多个维度的数据量映射到坐标轴上,这些坐标轴起始于同一个圆心点,通常结束于圆周边缘,将同一组的点使用线连接起来就成为雷达图。图38显示了雷达图。8. 面积图面积图又叫区域图。它是在折线图的基础之上形成的,它将折线图中折线与自变量坐标轴之间的区域使用颜色或者纹理填充,这样一个填充区域称为面积,颜色的填充可以更好地突出趋势信息。图39显示了面积图。图38雷达图图39面积图9. 漏斗图漏斗图适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观地发现和说明问题所在的环节,进而做出决策。漏斗图从上到下有逻辑上的顺序关系,表现了随着业务流程的推进业务目标完成的情况。图310显示了漏斗图。图310漏斗图10. 和弦图和弦图是一种显示矩阵中数据间相互关系的可视化方法,在图中节点数据沿圆周径向排列,节点之间使用带权重(有宽度)的弧线连接。图311显示了和弦图。图311和弦图11. 环形图环形图是由两个及两个以上大小不一的饼图叠在一起,挖去中间部分所构成的图形,主要用于区分或表明某种关系。图312显示了环形图。12. 直方图直方图的形状类似于柱状图,却有着与柱状图完全不同的含义。直方图涉及统计学的概念,首先要对数据进行分组,然后统计每个分组内数据元的数量。图313显示了直方图。图312环形图图313直方图13. 热力图热力图以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示,热力图可以显示不可点击区域发生的事情。图314显示了热力图。图314热力图14. 仪表盘图仪表盘图是一种拟物化的图表,刻度表示度量,指针表示维度,指针角度表示数值。仪表盘图就像汽车的速度表一样,有一个圆形的表盘及相应的刻度,有一个指针指向当前数值。目前很多的管理报表或报告上都使用这种图表,以直观地表现出某个指标的进度或实际情况。图315显示了仪表盘图。图315仪表盘图15. 密度图密度图用于显示数据在连续时间段内的分布状况。这种图表是直方图的变种,使用平滑曲线来绘制数值水平,从而得出更平滑的分布。密度图的峰值显示数值在该时间段内最为高度集中的位置。图316显示了密度图。图316密度图
大数据是现代社会高科技发展的产物,相对于传统的数据分析,大数据是海量数据的集合,它以采集、整理、存储、挖掘、共享、分 析、应用、清洗、可视化为核心,正广泛地应用在军事、金融、环境保护、通信等各个行业中。 数据可视化是关于数据视觉表现形式的技术,也是科学、设计和艺术3个学科的交叉领域, 对于大数据专业的学生来讲,数据可视化是极其重要的一门课程。 本书以理论与实践操作相结合的方式深入讲解大数据分析的基本知识和实现的基本技术,在内容设计上既有上课时老师的讲述部分, 包括详细的理论与典型的案例,又有大量的实训环节,双管齐下,极大地激发了学生在课堂上的学习积极性与主动创造性,让学生在 课堂上跟上老师的思维,从而学到更多有用的知识和技能。 本书内容共10章,分别为大数据可视化概述、大数据可视化原理、大数据可视化方法、数据可视化工具、Excel数据可视化、Tableau 数据可视化、ECharts与pyecharts数据可视化、Python数据可视化、大数据可视化行业分析以及大数据可视化综合实训。 本书的特色如下: (1) 采用“理实一体化”教学方式,既有课堂上老师的讲述,又有学生独立思考、上机操作的内容。 (2) 对大数据的可视化实现采用了多种方式,既有开源工具的可视化实现,又有大数据下的可视化编程语言实现。 (3) 编写本书的作者都具有多年的教学经验,全书重难点突出,能够激发学生的学习热情。 (4) 重点内容及重点案例配有微课,学生可在课后反复观看。 注: 本书提供教学大纲、教学课件、电子教案、习题答案、程序源码、教学进度表等配套资源, 扫描封底的课件二维码可以下载。本书还提供300分钟的视频讲解,扫描书中相应章节的二维码,可以在线观看、学习。 本书可作为大数据、云计算、软件技术、信息管理、计算机网络等专业的教材,也可作为大数据爱好者的自学参考书。 本书建议学时为72学时,具体分布如下表所示。 章节建 议 学 时 大数据可视化概述4 大数据可视化原理6 大数据可视化方法6 数据可视化工具4 Excel数据可视化8 续表 章节建 议 学 时 Tableau数据可视化8 ECharts与pyecharts数据可视化8 Python数据可视化18 大数据可视化行业分析4 大数据可视化综合实训6 本书由黄源、蒋文豪、徐受蓉担任主编,贾雯静、王宇晓和王力担任副主编。其中,黄源编写了第1章、第3章、第6~8章和第10章; 蒋文豪编写了第5章; 徐受蓉编写了第4章; 王宇晓和黄源共同编写了第2章; 贾雯静和王力共同编写了第9章。徐受蓉教授对书中 内容进行了审阅。本书由黄源负责统稿工作。 本书是校企合作的成果,在编写过程中得到了中国电信金融行业信息化应用重庆基地总经理助理杨琛的大力支持 ,在此表示感谢。 编者在编写本书的过程中参阅了大量的相关资料,在此 对相关作者表示感谢,并对清华大学出版社的魏江江分社长和王冰飞老师的辛勤工作表示感谢。 由于编者水平有限,书中难免会出现疏漏之处,衷心希望广大读者批评指正。 编者 2020年1月于重庆