Python商业数据分析:零售和电子商务案例详解pdf下载pdf下载

Python商业数据分析:零售和电子商务案例详解百度网盘pdf下载

作者:
简介:本篇主要提供Python商业数据分析:零售和电子商务案例详解pdf下载
出版社:电子工业出版社
出版时间:2021-07
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

产品特色

内容简介

本书以零售和电子商务为业务背景,使用Python工具解决业务场景中的数据分析需求。全书涵盖数据采集、数据存储、数据处理、数据分析、数据可视化和数据建模的内容。

本书适合零售和电子商务运营人员以及想要从事商业数据分析工作的人员阅读,也可以作为高校和培训机构相关课程的教材。


作者简介

零一,原名陈海城。杭州沐垚科技有限公司总经理,具有11年电商数据分析从业经验。代表作品有《Python数据爬虫、清洗及可视化实战》《淘宝、天猫电商数据分析与挖掘实战》。


精彩书评

商业数据分析的本质是要为企业解决实际问题,既要了解市场,又要懂得分析方法,最重要的是能落地。本书用Python呈现了完整的商业数据分析的过程,场景丰富,为入门和进阶提供了最佳实践路线。

张丹 青萌数海CTO,《R的极客理想》系列图书作者

数据已经成为现代企业的经营要素之一,数据分析对企业的经营有着举足轻重的影响。零一这本书以业务场景为背景,使用Python工具去解决实际工作中的问题,比较落地,不会概念化。

徐晶 广州思迈特软件有限公司高级副总裁、联合创始人


目录

1 Python 基础 1

1.1 安装Python 环境 2

1.1.1 Python 3.6.2 安装与配置 2

1.1.2 获取PyCharm 4

1.1.3 获取Anaconda 4

1.2 Python 操作入门 6

1.2.1 编写第一段Python 代码 6

1.2.2 Python 基本操作 9

1.2.3 Python 变量 11

1.2.4 Python 数据类型 11

1.2.5 Python 控制语句与函数 17

1.2.6 Python 自定义函数 20

2 Python 商业数据分析基础 21

2.1 什么是数据分析 22

2.1.1 理解数据分析 22

2.1.2 数据分析的两个核心思维 23

2.1.3 数据分析的方法论 23

2.2 Python 在商业分析中的价值 32

2.2.1 人生苦短,我用Python 32

2.2.2 Python 在商业分析应用中的优势 33

2.3 数据采集 33

2.3.1 采集数据前的准备工作 33

2.3.2 Requests 库 40

2.4 数据库操作及文件读写 48

2.4.1 MySQL 数据库 48

2.4.2 数据库操作 50

2.5 NumPy 数组处理 54

2.5.1 一维数组操作 54

2.5.2 多维数组操作 56

2.5.3 数组运算 60

2.6 Pandas 数据处理 61

2.6.1 数据导入与导出 61

2.6.2 数据描述性统计 62

2.6.3 数据透视汇总 63

2.7 商业分析可视化 65

2.7.1 柱状图 66

2.7.2 饼图 68

2.7.3 线图 69

2.7.4 散点图 70

3 Python 与市场分析案例 73

3.1 案例:市场大盘容量分析 75

3.1.1 案例背景及数据理解 75

3.1.2 计算市场绝对规模 76

3.1.3 计算市场相对规模 78

3.1.4 绘制柱状图和饼图 79

3.2 案例:市场趋势分析 81

3.2.1 案例背景及数据理解 82

3.2.2 根据时间合并市场数据 83

3.2.3 补齐缺失月的数据 84

3.2.4 绘制趋势图 89

3.2.5 计算市场增量 94

3.2.6 绘制组合图 94

3.3 案例:细分市场分析 95

3.3.1 案例背景及数据理解 96

3.3.2 类别的分布分析 96

3.3.3 识别潜力细分市场 99

3.3.4 潜力细分市场需求分析 104

3.3.5 消费者需求分析 106

4 Python 与店铺数据化运营案例 115

4.1 案例:用Python 做SEO 116

4.1.1 案例背景及数据理解 116

4.1.2 关键词词根分词与统计 117

4.1.3 可视化图形 118

4.2 案例:用Python 做推广方案 122

4.2.1 案例背景及数据理解 122

4.2.2 计算渠道投放预算的最优解 124

4.2.3 计算品类投放预算的最优解 126

4.2.4 计算各个品类在不同渠道的最优解 127

4.3 案例:用Python 分析竞品 131

4.3.1 案例背景及数据理解 131

4.3.2 采集数据 131

4.3.3 竞品调价预警 134

5 Python 与数字营销案例 137

5.1 案例:基于关联规则的产品推荐 138

5.1.1 算法原理及案例背景 138

5.1.2 创建商品项集 141

5.1.3 建立函数挑选最小支持度项集 143

5.1.4 训练步骤项集函数 144

5.2 案例:基于聚类算法的商品推荐 147

5.2.1 算法原理及案例背景 147

5.2.2 消费者聚类 150

5.2.3 基于消费者聚类的推荐 167

5.3 案例:基于协同过滤算法的产品推荐 176

5.3.1 算法原理及案例背景 176

5.3.2 数据准备 178

5.3.3 推荐算法建模 179

5.4 案例:消费者舆情分析 183

5.4.1 案例背景及数据理解 183

5.4.2 案例实现 183

6 Python 与销售预测案例 187

6.1 案例:基于业务逻辑的预测算法模型 188

6.1.1 案例背景及数据理解 188

6.1.2 案例实现 188

6.2 案例:基于时序算法预测库存 189

6.2.1 算法原理及案例背景 189

6.2.2 数据及时序检查 191

6.2.3 时间序列建模 198

6.2.4 循环迭代的ARIMA 模型 203

6.3 案例:电商的库存预测算法建模 207

6.3.1 算法原理及案例背景 208

6.3.2 准备数据 209

6.3.3 计算补货量 211

6.4 案例:用户成单预测 212

6.4.1 算法原理及案例背景 212

6.4.2 数据准备 215

6.4.3 数据挖掘 243

6.5 案例:用户流失预测 246

6.5.1 算法原理及案例背景 246

6.5.2 数据准备 249

6.5.3 数据挖掘 254


精彩书摘

Python与市场分析案例

市场分析是运营过程中非常高频的场景,在拓展市场或者做阶段性战略目标时都离不

开市场分析,市场分析的结果是给决策者最好的支撑。

市场分析是指应用统计学、计量经济学等分析工具对特定市场的运行状况、产品生产、销售、消费、技术、市场竞争力、市场竞争格局、市场政策等市场要素进行深入的分析,从而发现市场运行的内在规律,进一步预测未来市场发展的趋势。

市场分析是发现和掌握市场运行规律的必经之路,对指导市场内企业的经营规划和发展具有决定性的意义。

1.市场分析的思路

市场分析是商业行为中非常重要的环节,是做策划、定位的前道工序。决策者只有了解市场,才能做出准确有效的决策。市场分析需要2 ~ 3 年的历史数据,如果历史数据的年限太少,则难以全面且准确地对市场做出预判。

l 市场容量(market volume)分析:这里分析的是市场相对规模。市场规模(market sizing)是难以估算的,根据统计学的方式估算的结果并不靠谱,因此用电商平台的市场数据(抽样)来分析电商的相对规模,给决策者提供有价值的参考依据。

l 市场趋势(market trends)分析:这是对市场的自然规律进行探索,以及对未来的发展趋势进行预测,让决策者提前根据市场发展趋势做出预判,并对经营策略进行调整。

l 市场细分(market segmentation)分析:市场细分是市场选择的基础,根据消费者群体将市场划分成多个子市场,子市场之间的需求存在着明显的差异。

2.市场数据的收集

市场分析的数据需要根据分析的对象确定收集范围。如果是线下零售数据,则个人或企业都难以使用技术手段收集,线下数据需要使用传感器等设备,并且拿到数据的授权才可以获得这类数据;如果是线上零售数据,则较为简单,可以通过购买电商平台提供的数据,也可以自行采集公开的页面数据。

(1)线下零售数据可在以下系统收集。

l 收银系统,系统中有每一笔订单的数据。

l CRM(客户关系管理)系统,系统中有客户的消费数据。

l 客流统计系统,系统中有商超或门店的客流量数据。

l ERP(企业资源计划)系统,系统中有销售的产品数据。

(2)线上零售数据可在以下渠道收集。

l 电商平台官方提供的行业数据平台。平台中有行业的数据,具体字段则是随提供数据的平台的不同而不同,官方提供的数据以指数类数据为主。

l 电商平台的公开页面,需要自行采集累积原始资料,而且只有连续的数据才有价值。因为是原始资料,所以可以支持自由度最大的分析,但自行累积的时间花费较长。

l 第三方电商数据平台。第三方都是采集公开的页面数据后经过清洗、统计、汇总等环节提供给用户的数据,虽然可以节省时间和成本,但是不能像自行采集累积那样拥有原始资料。

3.1 案例:市场大盘容量分析

市场容量也称为行业规模,是指某个市场在统计期间的需求总价值。市场容量分析是对行业规模的分析和判断,市场规模决定了行业中企业发展的天花板。

3.1.1 案例背景及数据理解

1.案例背景

市场容量分析的是市场绝对规模和相对规模,通过规模可以掌握市场的大小以及瓶颈。

l 业务需求:某企业要拓展品类,需要了解市场的大小。

l 分析目的:将市场数据分类汇总,整理成柱状图或饼图,以便于汇报。

2.数据说明

本节提供了驱虫剂行业下7 个子行业3 年的交易额数据,每个子行业的数据都在一张表格中,表格的格式是XLSX。本节任务是将每个表格中3 年的交易额数据进行汇总,并将汇总后的结果放在一起。

数据字段如下。

l 时间:对应记录统计的时间。

l 交易金额:统计时间内支付的交易金额。

3.案例实现思路

(1)将数据进行汇总,并计算绝对份额。

(2)计算相对份额。

(3)绘制柱状图和饼图。

下面介绍案例实现过程。

3.1.2 计算市场绝对规模

加载Pandas 库,代码如下。

import pandas as pd

使用Pandas 库导入数据,代码如下。

# 文件路径为python 文件位置下的相对路径

dwx=pd.read_excel(" 电商案例数据及数据说明/ 驱虫剂市场/ 电蚊香套装市场近三年交易额.xlsx")

fmfz=pd.read_excel(" 电商案例数据及数据说明/ 驱虫剂市场/ 防霉防蛀片市场近三年交易额.xlsx")

msmc=pd.read_excel(" 电商案例数据及数据说明/ 驱虫剂市场/ 灭鼠杀虫剂市场近三年交易额.xlsx")

mz=pd.read_excel(" 电商案例数据及数据说明/ 驱虫剂市场/ 盘香灭蟑香蚊香盘市场近三年交易

额.xlsx")

wxq=pd.read_excel(" 电商案例数据及数据说明/ 驱虫剂市场/ 蚊香加热器市场近三年交易额.xlsx")

wxp=pd.read_excel(" 电商案例数据及数据说明/ 驱虫剂市场/ 蚊香片市场近三年交易额.xlsx")

wxy=pd.read_excel(" 电商案例数据及数据说明/ 驱虫剂市场/ 蚊香液市场近三年交易额.xlsx")

1.观察数据

打印前5 行数据和后5 行数据(每个市场都要查看,此处仅以电蚊香市场为例)。使用head() 方法查看前5行数据,代码如下。

print(dwx.head())

输出结果

时间 交易金额

0 2018-10-01 106531.29 元

1 2018-09-01 105666.63 元

2 2018-08-01 201467.03 元

3 2018-07-01 438635.29 元

4 2018-06-01 953749.78 元

使用tail9() 方法查看后5 行数据,代码如下。

print(dwx.tail())

输出结果

时间 交易金额

31 2016-03-01 352013.31 元

32 2016-02-01 96979.48 元

33 2016-01-01 108412.71 元

34 2015-12-01 110068.83 元

35 2015-11-01 185094.22 元

2.查看数据的基本结构

使用info() 方法查看数据的字段及类型,代码如下。

print(dwx.info())

输出结果

RangeIndex: 36 entries, 0 to 35

Data columns (total 2 columns):

时间 36 non-null datetime64[ns]

交易金额 36 non-null float64

dtypes: datetime64[ns](1), float64(1)

通过对数据的探索与观察,数据集是7 个子行业数据。每个子行业的数据中一共有两列字段:时间和交易金额,其中时间的跨度是2015 年11 月至2018 年10 月。

用sum() 方法汇总数据,代码如下。

dwx[' 交易金额'].sum() # 汇总单张表格数据

将7 张表格的数据汇总并形成一张表,代码如下。

m_sum=pd.DataFrame(data=[dwx.sum().values,fmfz.sum().values,msmc.sum().values

,mz.sum().values,wxq.sum().values,wxp.sum().values,wxy.sum().values]

,columns=[' 销售额']

,index=[' 电蚊香',' 防霉防蛀',' 灭鼠灭虫',' 灭蟑',' 蚊香加热器',' 蚊香片',' 蚊香液'])

print(m_sum)



前言/序言

推荐序

我个人从事数据挖掘及大数据分析工作已经超过25 年。对于要如何成为一个好的数据科学家,我个人认为要具备以下三个特质:

第一是对数据的热爱,见到数据就像见到心仪的人一样,想去亲近它,想去了解它。

第二是对相关数据分析工具的纯熟运用,让你能随心所欲地驾驭数据。

第三是懂得如何将数据分析与行业领域知识相结合,让数据分析能有效地协助领导做出适当的决策。

我所认识的零一就是具备这三项特质的一个人。听到他要出书,我很高兴,因为对于热爱数据分析的工作者又有福了。

零一的这本书从数据挖掘及商业数据分析的基础开始,循序渐进地引导读者,熟悉相关的数据分析的概念及工具。之后用市场分析、店铺数据化运营、数字营销及销售预测等案例,让读者了解如何将数据分析与零售和电子商务的实务进行完美的结合。本书的整体编排及架构我很喜欢,相信读完此书的人也会有同样的感受。

我们最近经常听到一句话就是,机器及将取代人力,因此还吓坏了许多人。其实从我的角度来说,要取代人的机器,还是人设计出来的。因此,解决这个问题的关键就是你自己。不仅仅机器需要深度学习,更需要深度学习的还是我们自己。零一的这本书就是大家开始深度学习的基础,是值得推荐的一本好书。

李御玺(Yue-Shi Lee)

台湾大学资讯工程博士

铭传大学资讯工程学系教授

中华资料采矿协会理事

前言

Python 已经成为时下最热门的计算机语言之一,应用范围十分广泛,甚至进入了小学课堂。目前许多书籍内容还是以学习如何使用Python 工具为主,在实际应用方面相对较少,特别是在零售分析方面的应用少之又少。大部分企业做数据分析还是以Excel 为主。在这个背景之下,笔者写这本书是为了能把Python 带入普通企业中。

Excel 能做的事情,Python 都可以完成,但是Python 能做的事情,Excel 未必可以做。

全书分为6 章。第1 章介绍Python 基础;第2 章重点介绍数据采集、数据库,以及常用的NumPy、Pandas、matplotlib 库;第3 章重点介绍市场分析案例;第4 章重点介绍SEO、推广方案和竞品分析的案例;第5 章重点介绍数字营销案例;第6章重点介绍销售预测案例。

这本书对Python 零基础的读者较不友好,建议Python 零基础的读者配套基础入门书籍学习。读者如果具备Python 基础,可以直接从第2 章读起。考虑到数据的敏感性和难度,本书案例在数据上做了部分精简,目前保留的案例数据集最大的只有500MB,从学习和掌握本书所述方法的角度,可以满足需求。

最后,鉴于作者的水平有限,书中存在的不足之处请读者谅解。

作者

2021 年5 月