本篇主要提供应用预测建模计算机与互联网电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
书[0名0]: | (正版特价)应用预测建模|229196 |
图书定价: | 99元 |
图书作者: | (美)马克斯·库恩(Max Kuhn);谢尔·约翰逊( Kjell Johnson) |
出版社: | [1机1]械工业出版社 |
出版日期: | 2016/5/1 0:00:00 |
ISBN号: | 9787111533429 |
开本: | 16开 |
页数: | 409 |
版次: | 1-1 |
作者简介 |
马克斯·库恩(Max Kuhn),康涅狄格州格罗顿市辉瑞全球研发非临床统计部[1主1]任,在制[yao]和诊断行业已有近20年应用预测模型的[纟巠]验,他还是很多R包的作者。 谢尔·约翰逊(Kjell Johnson),博士,在[yao]物研发和其他行业有近20年统计咨询和预测建模[纟巠]验,曾任辉瑞全球研发统计部[1主1]任。 |
内容简介 |
这是一本专注于预测建模的数据分析书,意在为实践者[扌是]供预测建模过程的指导,比如如何进行数据预处理、模型调[0优0]、预测变量重要性度量、变量选择等。读者可以从中[0学0]到许多建模方[0法0]以及[扌是]高对许多常用的、现代的有效模型的认识,如线性回归、非线性回归和分类模型,涉及树方[0法0]、支持向量[1机1]等。[0第0]10章和[0第0]17章分别研究混凝土混合物的抗压强度和作业调度两个案例。 作者重实际应用,轻数[0学0]理论,从实际数据出发,结合开源软[亻牛]R语言来求解实际问题,详细给出R代码和处理的步骤。R包AppliedPredictiveModeling包含书中使用的数据,以及可以用于重复书中每一章分析的R代码,让读者能在一定精度范围内重复本书的结果,并自然地将书中的预测建模方[0法0]应用到自己的数据上。章后附有习题,方便读者巩固所[0学0]。 这本业界互相推荐的[女子]书,适合所有数据分析人员阅读。 |
目录 |
译者序 前言 [0第0]1章导论 1.1预测与解释 1.2预测模型的关键部分 1.3专业术语 1.4实例数据集和典型数据场景 1.5概述 1.6符号 [0第0]一部分一般策略 [0第0]2章预测建模过程简介 2.1案例分析:预测燃油效能 2.2[1主1]题 2.3总结 [0第0]3章数据预处理 3.1案例分析:高内涵筛选中的细胞分组 3.2单个预测变量数据变换 3.3多个预测变量数据变换 3.4处理缺失值 3.5移除预测变量 3.6增加预测变量 3.7区间化预测变量 3.8计算 习题 [0第0]4章过度拟合与模型调[0优0] 4.1过度拟合的问题 4.2模型调[0优0] 4.3数据分割 4.4重抽样技术 4.5案例分析:信用[0评0]分 4.6选择调[0优0]参数值 4.7数据划分建议 4.8不同模型间的选择 4.9计算 习题 [0第0]二部分回归模型 [0第0]5章衡量回归模型的效果 5.1模型效果的定量度量 5.2方差偏差的[0权0]衡 5.3计算 [0第0]6章线性回归及其扩展 6.1案例分析:定量构效关系建模 6.2线性回归 6.3偏[*]小二乘[0法0] 6.4惩罚模型 6.5计算 习题 [0第0]7章非线性回归模型 7.1神[纟巠]网络 7.2多元自适应回归样条 7.3支持向量[1机1] 7.4K近邻 7.5计算 习题 [0第0]8章回归树与基于规则的模型 8.1简单回归树 8.2回归模型树 8.3基于规则的模型 8.4装袋树 8.5随[1机1]森林 8.6助推[0法0] 8.7Cubist 8.8计算 习题 [0第0]9章溶解度模型总结 [0第0]10章案例研究:混凝土混合物的抗压强度 10.1模型构建策略 10.2模型性能 10.3[0优0]化抗压强度 10.4计算 [0第0]三部分分类模型 [0第0]11章分类模型的效果度量 11.1类预测 11.2[0评0]估预测类 11.3[0评0]估类概率 11.4计算 [0第0]12章判别分析和其他线性分类模型 12.1案例分析:预测是否成功申请[纟巠]费 12.2逻辑回归 12.3线性判别分析 12.4偏[*]小二乘判别分析 12.5惩罚模型 12.6[*]近收缩质心 12.7计算 习题 [0第0]13章非线性分类模型 13.1非线性判别分析 13.2神[纟巠]网络 13.3灵活判别分析 13.4支持向量[1机1] 13.5K近邻 13.6朴素贝叶斯 13.7计算 习题 [0第0]14章分类树与基于规则的模型 14.1基本的分类树 14.2基于规则的模型 14.3装袋决策树 14.4随[1机1]森林 14.5助推[0法0] 14.6C5.0 14.7比较两种分类预测变量编码方式 14.8计算 习题 [0第0]15章[纟巠]费申请模型的总结 [0第0]16章对严重类失衡的补救方[0法0] 16.1案例分析: 预测房车保险所有[0权0] 16.2类失衡的影响 16.3模型调[0优0] 16.4选择截点 16.5调整先验概率 16.6不等案例[0权0]重 16.7抽样方[0法0] 16.8成本敏感度训练 16.9计算 习题 [0第0]17章案例研究:作业调度 17.1数据切分和模型策略 17.2结果 17.3计算 [0第0]18章衡量预测变量重要性 18.1数值结果变量 18.2分类结果变量 18.3其他方[0法0] 18.4计算 习题 [0第0]19章特征选择介绍 19.1使用无信息预测变量的结果 19.2减少预测变量个数的方[0法0] 19.3绕封[0法0] 19.4过滤[0法0] 19.5选择偏差 19.6案例分析:预测认[0知0]损伤 19.7计算 习题 [0第0]20章影响模型表现的因素 20.1[0第0]Ⅲ类错误 20.2结果变量的测量误差 20.3预测变量的测量误差 20.4连续变量离散化 20.5模型预测何时是可信的 20.6[0大0]样本的影响 20.7计算 习题 附录 附录A各种模型的总结 附录BR语言介绍 附录C值得关注的网站 参考文献 |