实用预测分析 pdf下载pdf下载

实用预测分析百度网盘pdf下载

作者:
简介:本篇提供书籍《实用预测分析》百度网盘pdf下载
出版社:中图网专营店
出版时间:2018-07
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

基本信息

书名:实用预测分析

定价:89.00元

作者: 拉尔夫·温特斯(Ralph Winters),刘

出版社:机械工业出版社

出版日期:2018-07-01

ISBN:9787111603351

字数:

页码:392

版次:1

装帧:平装

开本:16开

商品重量:0.4kg

编辑推荐


本书是一本与众不同的预测分析书,从技术和概念的角度介绍了很多不同的主题,如分析方法、敏捷、元数据、SQL、抽样和生存分析等。书中首先简洁地讲述预测分析的发展历史及R安装基础知识,然后详细介绍预测分析建模的6个步骤,你将学习输入、清洗以及准备建模数据所需的技巧。作者还探讨了为什么协作非常重要,敏捷迭代建模循环如何提高你的成功率,使你能顺利开发并部署佳的模型,进而在云计算环境中进一步扩展你的技能,通过学习Databricks和SparkR,你将能够对海量的数据进行预测模型的开发。 n
n
通过阅读本书,你将: n
?掌握如今业务上使用的核心预测分析算法 n
?学习实现一个成功的预测分析项目的6个步骤 n
?根据需求遴选正确的算法 n
?使用预测分析来研究医疗领域的问题 n
?实现预测分析来挽留和获得你的客户 n
?利用文本挖掘来理解非结构化数据 n
?在个人电脑或者Spark/Hadoop环境中开发模型 n
?为客户实现预测分析产品

内容提要


本书详细讲述了预测分析的原理、技术及实现,并深入讨论了大数据。重点着眼于掌握提高开发、实行预测分析所需的6项关键实用技能。本书还提供了来自市场、医疗和零售等行业的真实案例,有助于读者针对产品实现自己的预测分析。

目录


Contents 目  录 n
译者序 n
关于作者 n
关于审校者 n
前言 n
章预测分析入门 1 n
1.1许多行业中都有预测分析 2 n
1.1.1市场营销中的预测分析 2 n
1.1.2医疗中的预测分析 2 n
1.1.3其他行业中的预测分析 3 n
1.2技能和角色在预测分析中都很重要 3 n
1.3预测分析软件 4 n
1.3.1开源软件 5 n
1.3.2闭源软件 5 n
1.3.3和平共处 5 n
1.4其他有用的工具 5 n
1.4.1基础知识 6 n
1.4.2数据分析/研究 6 n
1.4.3数据工程 6 n
1.4.4管理 7 n
1.4.5数据科学团队 7 n
1.4.6看待预测分析的两种不同方式 7 n
1.5R 8 n
1.5.1CRAN 8 n
1.5.2安装R语言 8 n
1.5.3其他安装R语言的方法 8 n
1.6预测分析项目是如何组织的 9 n
1.7图形用户界面 10 n
1.8RStudio入门 11 n
1.8.1重新布局以保持和示例一致 11 n
1.8.2部分重要面板的简要描述 12 n
1.8.3创建新项目 13 n
1.9R语言控制台 14 n
1.10源代码窗口 15 n
1.11个预测模型 16 n
1.12第二个脚本 18 n
1.12.1代码描述 19 n
1.12.2predict函数 20 n
1.12.3检验预测误差 21 n
1.13 R语言包 22 n
1.13.1stargazer包 22 n
1.13.2安装stargazer包 23 n
1.13.3保存工作 24 n
1.14参考资料 24 n
1.15本章小结 24 n
第2章 建模过程 25 n
2.1结构化方法的优点 25 n
2.2分析过程方法 26 n
2.2.1CRISP-DM和SEMMA 27 n
2.2.2CRISP-DM和SEMMA的图表 27 n
2.2.3敏捷过程 28 n
2.2.4六西格玛和根本原因 28 n
2.2.5是否需要数据抽样 28 n
2.2.6使用所有数据 29 n
2.2.7比较样本与群体 29 n
2.3步:理解业务 30 n
2.4第二步:理解数据 36 n
2.4.1衡量尺度 36 n
2.4.2单变量分析 38 n
2.5第三步:数据准备 43 n
2.6第四步:建模 44 n
2.6.1具体模型说明 45 n
2.6.2逻辑回归 46 n
2.6.3支持向量机 47 n
2.6.4决策树 47 n
2.6.5降维技术 51 n
2.6.6主成分 51 n
2.6.7聚类 52 n
2.6.8时间序列模型 52 n
2.6.9朴素贝叶斯分类器 53 n
2.6.10文本挖掘技术 54 n
2.7第五步:评估 57 n
2.7.1模型验证 58 n
2.7.2曲线下面积 59 n
2.7.3样本内和样本外测试、前进测试 60 n
2.7.4训练/测试/验证数据集 60 n
2.7.5时间序列验证 61 n
2.7.6佳冠军模型的基准测试 61 n
2.7.7专家意见:人与机器 61 n
2.7.8元分析 61 n
2.7.9飞镖板方法 61 n
2.8第六步:部署 62 n
2.9参考资料 62 n
2.10本章小结 62 n
第3章 输入和探索数据 64 n
3.1数据输入 64 n
3.1.1文本文件输入 65 n
3.1.2数据库表格 66 n
3.1.3电子表格文件 67 n
3.1.4XML和JSON数据 67 n
3.1.5生成你自己的数据 68 n
3.1.6处理大型文件的技巧 68 n
3.1.7数据整理 68 n
3.2连接数据 69 n
3.2.1使用sqldf函数 69 n
3.2.2生成数据 70 n
3.2.3检查元数据 71 n
3.2.4使用内部连接和外部连接来合并数据 72 n
3.2.5识别有多个购买记录的成员 73 n
3.2.6清除冗余记录 74 n
3.3探索医院数据集 74 n
3.3.1str(df)函数的输出 74 n
3.3.2View函数的输出 75 n
3.3.3colnames函数 75 n
3.3.4summary函数 76 n
3.3.5在浏览器中打开文件 77 n
3.3.6绘制分布图 77 n
3.3.7变量的可视化绘图 78 n
3.4转置数据帧 80 n
3.5缺失值 84 n
3.5.1建立缺失值测试数据集 84 n
3.5.2缺失值的不同类型 85 n
3.5.3纠正缺失值 87 n
3.5.4使用替换过的值运行回归 90 n
3.6替换分类变量 91 n
3.7异常值 91 n
3.7.1异常值为什么重要 91 n
3.7.2探测异常值 92 n
3.8数据转换 96 n
3.8.1生成测试数据 97 n
3.8.2Box-Cox转换 97 n
3.9变量化简/变量重要性 98 n
3.9.1主成分分析法 98 n
3.9.2全子集回归 102 n
3.9.3变量重要性 104 n
3.10参考资料 106 n
3.11本章小结 106 n
第4章 回归算法导论 107 n
4.1监督学习模型和无监督学习模型 108 n
4.1.1监督学习模型 108 n
4.1.2无监督学习模型 108 n
4.2回归技术 109 n
4.3广义线性模型 110 n
4.4逻辑回归 110 n
4.4.1比率 111 n
4.4.2逻辑回归系数 111 n
4.4.3示例:在医疗中使用逻辑回归来预测疼痛阈值 112 n
4.4.4GLM模型拟合 114 n
4.4.5检验残差项 115 n
4.4.6添加变量的分布图 116 n
4.4.7p值及其效应量 117 n
4.4.8p值及其影响范围 118 n
4.4.9变量选择 119 n
4.4.10交互 121 n
4.4.11拟合优度统计量 123 n
4.4.12置信区间和Wald统计 124 n
4.4.13基本回归诊断图 124 n
4.4.14分布图类型描述 124 n
4.4.15拟合优度:Hosmer-Lemeshow检验 126 n
4.4.16正则化 127 n
4.4.17示例:ElasticNet 128 n
4.4.18选择一个正确的Lambda 128 n
4.4.19基于Lambda输出可能的系数 129 n
4.5本章小结 130 n
第5章决策树、聚类和SVM导论 131 n
5.1决策树算法 131 n
5.1.1决策树的优点 131 n
5.1.2决策树的缺点 132 n
5.1.3决策树的基本概念 132 n
5.1.4扩展树 132 n
5.1.5不纯度 133 n
5.1.6控制树的增长 134 n
5.1.7决策树算法的类型 134 n
5.1.8检查目标变量 135 n
5.1.9在rpart模型中使用公式符号 135 n
5.1.10图的解释 136 n
5.1.11输出决策树的文本版本 137 n
5.1.12修剪 138 n
5.1.13渲染决策树的其他选项 139 n
5.2聚类分析 140 n
5.2.1聚类分析应用于多种行业 140 n
5.2.2什么是聚类 140 n
5.2.3聚类的类型 141 n
5.2.4k均值聚类算

作者介绍


作者简介 n
n
拉尔夫·温特斯(Ralph Winters)目前在一家医疗服务公司担任数据架构师。他已经给很多名列世界500强的大企业提供过自己在统计和分析方面的经验,包括金融、市场营销、保险、医疗和制药领域的企业。他的工作包括很多不同类型的预测分析项目,包括客户保留、反洗钱、客户之声文本挖掘分析,以及医疗风险和客户选择模型。

文摘


序言