增强型分析 pdf下载pdf下载

增强型分析百度网盘pdf下载

作者:
简介:本篇提供书籍《增强型分析》百度网盘pdf下载
出版社:出版集团图书专营店
出版时间:2019-09
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

基本信息

  • 商品名称:增强型分析(AI驱动的数据分析业务决策与案例实践)/数据分析与决策技术丛书
  • 作者:彭鸿涛//张宗耀//聂磊
  • 定价:89
  • 出版社:机械工业
  • 书号:9787111634164

其他参考信息(以实物为准)

  • 出版时间:2019-09-01
  • 印刷时间:2019-09-01
  • 版次:1
  • 印次:1
  • 开本:16开
  • 包装:平装
  • 页数:258
  • 字数:262千字

编辑推荐语

(1)本书 前瞻性:增强型分析是数据分析和数据科学的未来,人工智能技术为数据分析与决策赋能是未来必然发展趋势; (2)本书 性:详细讲解了序列分析、预测分析、规范性分析、RNN、CNN、GAN等前沿的数据处理技术和人工智能技术; (3)本书 性:本书3位作者是来自德勤、华为和前IBM的数据科学家,都在数据科学和人工智能领域有超过10年以上的工作经验; (4)本书 实战性:本书不只是讲技术和工具,重点还有技术如何与实际的业务相结合,包含大量的实战案例。

内容提要

内容简介 增强型分析是数据科学的未来,本书讲解了如何通过前沿的大数据技术和AI技术实现智能的数据分析和业务决策,即增强型分析。
    本书的三位作者是来自德勤、前华为和前IBM的数据科学家,在大数据和AI领域至少都有10年以上的工作经验,他们将各自多年来在“构建数据挖掘模型,解决实际业务问题”方面积累的经验全部总结在了这本书中。
    全书的内容由两条主线贯穿: 技术主线:一方面讲解了预测模型、序列分析、预测分析、Prescriptive分析等前沿数据处理技术,一方面讲解了CNN、RNN和GNN等前沿的AI技术如何为数据分析赋能。
    业务主线:在数字化转型的大时代背景下,如何通过数据分析实现智慧营销、智慧风险管控,实现由初级的“主动营销”到“被动营销”,再到“全渠道协同营销”等营销手段的升级应用。
    本书的重点聚焦在本质内容上,即数据处理、算法及模型、“模型洞见到业务决策”的分析等。
     全书共8章: 第1章:作者结合自己的从业经验介绍了数据科学家的职业生涯发展、工作模式和工作方法要点等内容,为有志成为数据科学家的读者指明了道路和方向; 第2章:从描述性分析的角度讲解了数据探索、数据预处理衍生指标加工方面的技巧; 第3章:介绍了预测类模型构建时的新方法、新思路、新工具; 第4章:讲解了序列分析的相关内容,包括序列模式、序列规则、序列预测等的挖掘与应用,用实例的方式说明了算法的原理、特点和使用技巧; 第5章:介绍了人工智能下一个阶段的重点领域,即如何应用数据分析做出*优决策; 第6~8章:通过与传统模型的对比,介绍了CNN、RNN、GNN等算法的原理,通过大量的实例说明了这些AI技术在数据分析与决策领域的用法和实际效果。

作者简介

作者简介 彭鸿涛 德勤企业咨询总监兼首席数据科学家,德勤 AI团队核心成员,德勤数字化转型、智慧营销、智慧风控、客户体验等核心咨询服务方案的顾问。
  2008年加入SPSS并与跨 团队一起进行Analytical Decision Management决策自动化工具的开发,与 外团队一起构建了SPSS在不同应用领域的解决方案,其中某些方案现已成长为IBM的知名解决方案;2014年加入IBM GBSC部门,领导数据分析团队,针对不同客户设计和实施数据分析的方案;2016年加入IBM GBS GBS Cognitive Business Decision Support担任CTO和首席数据科学家,领导团队开发实施了有一定行业影响力的人工智能应用;2017年加入德勤企业咨询担任金融服务总监及首席数据科学家,领导团队开拓数字化转型背景下的新型咨询服务方案,期间高质量交付大型银行的数字化转型及实施相关项目并得到客户高度认可。
   张宗耀 上海全应科技有限公司数据科学家,前华为企业智能部门数据科学家,前IBM SPSS 算法组件团队算法工程师。
   2009年加入IBM SPSS算法组件团队,负责Statistic和Modeler产品的升级和维护;2012年开始大数据算法组件的设计和开发,为分布式分析引擎提供了核心计算单元, 完成开发了分布式平台下的广义线性模型、自动建模算法、ADMM优化算法等,打造了分析引擎平台以及SPSS Modeler产品的*具竞争力算法模块;2015年开始投入Spark分布式框架的算法设计和开发, 完成开发了生存分析算法、时间序列相关算法等,丰富了SPSS产品的核心算法组件。2016年加入华为,先后就职于华为的数据挖掘团队,以及企业智能部门的机器学习服务团队和工业解决方案团队,负责算法、机器学习、实时预测、数据分析,以及行业解决方案的设计、开发和部署相关的工作。
  聂磊 陕西万禾数字科技有限公司CTO,前IBM SPSS 数据科学家,前IBM Watson Analytics数据分析引擎技术主管及架构师。
  2008 年加入IBM Analytical Decision Management团队, 开发了业务规则引擎和基于优化技术的预测性维护解决方案;2014年加入IBM Watson Analytics团队,担任技术主管兼架构师, 了IBM Watson Analytics数据分析引擎基于Spark技术的转换,极大提高了平台的计算能力;2017年担任IBM Cognos Analytics团队架构师,主持了自动化技术的引入。

目录

序一
序二
前言
第1章 数据科学家的成长之路1
1.1 算法与数据科学家1
1.1.1 数据科学、人工智能、机器学习等2
1.1.2 室内活动还是室外活动3
1.2 数据科学家不断成长的几个阶段3
1.2.1 算法——如何构建数据分析模型5
1.2.2 用法——如何回头看模型6
1.2.3 业务——如何产生 大价值7
1.2.4 战略——如何 广8
1.3 数据科学家的工作模式与组织结构9
1.3.1 数据驱动还是业务驱动9
1.3.2 数据科学家团队的组织结构9
1.4 数据科学家的工作方法要点10
第2章 大数据探索及预处理13
2.1 大数据探索13
2.1.1 数值类型13
2.1.2 连续型数据的探索14
2.1.3 分类型数据的探索19
2.1.4 示例:数据探索20
2.2 数据预处理26
2.2.1 数据清洗26
2.2.2 数据变换29
2.2.3 数据归约41
2.3 衍生指标的加工44
2.3.1 衍生指标概述45
2.3.2 将数值转化为百分位数45
2.3.3 把类别变量替换为数值46
2.3.4 多变量组合47
2.3.5 从时间序列中提取特征47
第3章 预测模型的新技术49
3.1 集成学习49
3.1.1 Averaging方法49
3.1.2 Boosting方法51
3.2 Gradient Tree Boosting介绍53
3.2.1 梯度与梯度下降53
3.2.2 Gradient Tree Boosting算法的原理55
3.3 Gradient Tree Boosting的改进方向57
3.3.1 Gradient Tree Boosting的使用要点57
3.3.2 Regularization59
3.3.3 XGBoost介绍60
3.4 模型的 参数设置60
3.5 投票决定 终预测结果65
3.6 让模型在训练结束后还能被 新66
3.6.1 热启动67
3.6.2 增量学习67
3.7 多输出预测68
3.7.1 Binary Relevance69
3.7.2 Classifier Chain70
3.7.3 Ensemble Classifier Chain70
3.8 案例:如何给客户从数百个产品中寻找合适的产品71
3.8.1 问题提出72
3.8.2 建模思路72
3.8.3 模型训练及应用73
第4章 序列分析76
4.1 通过客户行为研究做出服务策略76
4.2 频繁项集、关联规则的挖掘77
4.2.1 基本概念77
4.2.2 频繁或稀疏项集的挖掘78
4.2.3 关联规则的挖掘86
4.3 序列模式的挖掘以及应用88
4.3.1 换种视角观察项间的顺序88
4.3.2 “事无巨细”还是“事有巨细”89
4.3.3 序列挖掘的相关算法介绍92
4.3.4 示例:挖掘购买物品的序列模式96
4.4 序列规则的挖掘以及应用101
4.4.1 将频繁序列通过业务解读转换为行动指南101
4.4.2 序列规则的挖掘实现行动指南102
4.4.3 序列规则的挖掘算法102
4.4.4 示例:通过客户购买产品的序列 合适的产品104
4.5 序列预测的挖掘以及应用107
4.5.1 序列规则与序列预测的关系107
4.5.2 序列预测算法的介绍108
4.5.3 示例:客户下一步会做什么110
第5章 应用数据分析做出 决策114
5.1 Prescriptive分析概述114
5.1.1 业务分析的3个层次115
5.1.2 为什么需要Prescriptive分析116
5.1.3 什么时候需要Prescriptive分析117
5.2 确定因素和非确定因素下的决策分析118
5.3 What-If分析和Goal Seeking分析121
5.4 优化技术介绍122
5.4.1 数据挖掘算法中常用的优化技术122
5.4.2 优化问题求解工具介绍127
5.4.3 CVXPY优化工具在机器学习算法中的应用130
5.4.4 应用优化技术寻找 产品 134
5.5 仿真分析135
5.5.1 蒙特卡洛的介绍135
5.5.2 采用蒙特卡洛方法进行重采样137
5.6 马尔可夫链及马尔可夫决策过程143
5.6.1 马尔可夫过程及马尔可夫链145
5.6.2 马尔可夫决策过程及应用工具148
5.6.3 应用马尔可夫决策过程研究营销策略及客户生命周期价值151
第6章 深入探讨CNN155
6.1 换个角度讨论CNN155
6.1.1 卷积是在做什么156
6.1.2 人脸检测与人脸识别159
6.1.3 深度学习意味着什么165
6.1.4 CNN的结构168
6.1.5 CNN的训练及结果172
6.2 用CNN做人脸识别174
6.2.1 数据加载175
6.2.2 使用ImageDataGenerator175
6.2.3 定义模型和训练模型176
6.2.4 详细探究卷积 终的效果178
6.3 Embedding181
6.3.1 文本向量化的一般方法181
6.3.2 Word Embedding的原理及实现186
6.3.3 利用Word Embedding实现翻译190
6.3.4 Embedding的用途不止于Word Embedding192
6.4 一个例子:文本分类193
6.4.1 采用传统分类模型实现文本分类193
6.4.2 采用CNN进行文本分类196
6.4.3 采用FastText进行文本分类200
第7章 深入探讨RNN201
7.1 两种建模方法:Prediction 和 Sequence Labeling201
7.1.1 Prediction的特点201
7.1.2 Sequence Labeling的特点202
7.2 RNN及其变种的详细原理203
7.2.1 RNN的Activation 函数204
7.2.2 RNN 的初级神经元及计算逻辑205
7.2.3 LSTM的神经元及计算逻辑205
7.2.4 GRU的神经元与计算逻辑206
7.2.5 深度RNN的原理207
7.2.6 RNN算法的输入输出形式208
7.3 利用LSTM预测股票价格209
7.3.1 模型构建及验证209
7.3.2 模型应用的探讨216
7.4 让计算机学会写唐诗216
7.4.1 构想:如何让计算机能够写出唐诗216
7.4.2 构建:模型实现的过程218
7.5 预测客户的下一个行为221
7.5.1 构想:如何利用LSTM实现客户行为的预测221
7.5.2 构建:模型实现过程222
7.6 计算机,请告诉我你看到了什么226
7.6.1 构想:如何让计算机生成图片描述226
7.6.2 实现:逐步构建图片描述生成模型227
7.6.3 VQA232
第8章 深入探讨GAN235
8.1 基本原理235
8.1.1 构想235
8.1.2 GAN的基本结构237
8.1.3 GAN模型训练及应用过程240
8.1.4 GAN原理的再探索241
8.2 让计算机书写数字243
8.2.1 建模思路243
8.2.2 基本实现过程244
8.2.3 采用DCGAN来实现248
8.3 让计算机画一张人脸251
8.3.1 如何让计算机理解我们的要求252
8.3.2 基本实现过程253