统计分析:以R语言为工具pdf下载pdf下载

统计分析:以R语言为工具百度网盘pdf下载

作者:
简介:本篇主要提供统计分析:以R语言为工具pdf下载
出版社:北京大学出版社
出版时间:2021-08
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

产品特色

编辑推荐

1.从R语言的下载与安装讲起,真正实现零基础学习统计分析。
2.详细介绍R 语言中数据管理及预处理操作方法,辅以大量有梗有趣的实例,讲解深入浅出,通俗易懂,富有趣味性。
3.从数据选择、数据清洗、数据处理到数据可视化,全流程专业讲解,挖掘主流算法与模型,解决实际问题,理论基础与实用性并重。
4.每章设有课后习题,学习巩固两不误;详细答案讲解,解决学习路上的所有疑惑。
5.超完整数据打包文件、课程讲解PPT课件、软件包、案例代码,“保姆式”服务,全方位为读者学习保驾护航。

内容简介

本书围绕经典的统计方法与 R 语言工具,从基本的统计描述分析方法出发,讲解了参数估计与假设检验、线性回归、逻辑回归、降维分析方法,每一章重点介绍一种经典方法或统计模型,对其基本定义、模型形式、统计方法的推导与解读等都给出了细致的讲解。此外,为了将理论与实践紧密结合,本书每一章均提供了不同业务场景下的R语言编程实例,帮助读者练习巩固。本书适合相关学科本科生及研究生,以及对数据分析及建模感兴趣的读者。

作者简介

朱雪宁,复旦大学大数据学院副教授。2017年获得北京大学光华管理学院商务统计与经济计量系博士学位,入选2019年度上海市青年科技英才扬帆计划,主持并参与多项国家自然科学基金。主要研究领域为网络数据分析及商务统计应用等,在国内外期刊发表论文二十余篇,著有《R语言:从数据思维到数据实战》。
任怡萌,伦敦政治经济学院博士
张桂维,复旦大学大数据学院硕士
米汶权,复旦大学大数据学院硕士

内页插图

目录

统计分析与R语言 1
1.1统计分析简介 1
1.1.1了解数据及业务问题 002
1.1.2数据清洗与预处理 003
1.1.3数据描述及探索性分析 003
1.1.4模型构建及解读 004
1.2 R语言简介 006
1.2.1为何要使用R语言 006
1.2.2 R语言的下载与安装 007
1.2.3 R语言的使用 010
1.2.4工具包 014
1.3本章小结 015
1.4本章习题 016
R 语言中的数据管理及预处理
2.1基本数据类型 019
2.1.1数值型 019
2.1.2字符型 020
2.1.3逻辑型 020
2.1.4因子型 021
2.1.5时间型 022
2.2 数据结构 022
2.2.1向量 022
2.2.2矩阵 028
2.2.3数组 031
2.2.4数据框 033
2.2.5列表 036
2.3 数据的读入及写出 042
2.3.1直接输入数据 042
2.3.2从带分隔符的文本文件中导入数据 042
2.3.3导入Excel 数据 044
2.3.4逐行读入数据 044
2.3.5数据的写出 045
2.4 数据集管理及预处理 046
2.4.1了解数据概况 047
2.4.2变量类型转换 048
2.4.3时间型数据的操作 050
2.4.4数据集合并 051
2.4.5数据缺失、异常 052
2.5本章小结 053
2.6本章习题 053
基本统计分析 54
3.1基本描述统计量 056
3.1.1频数统计 056
3.1.2均值 057
3.1.3分位数 057
3.1.4方差、标准差 058
3.1.5协方差与相关系数 059
3.1.6最大值、最小值 061
3.1.7峰度和偏度 062
3.2汇总分析 063
3.2.1交叉列联表 063
3.2.2描述统计量的分组统计 065
3.3本章小结 066
3.4本章习题 067
数据描述与可视化 68
4.1统计表格 070
4.1.1变量说明表 070
4.1.2分组统计表 071
4.2数据可视化基础 072
4.2.1统计图形 072
4.2.2柱状图 073
4.2.3饼图 076
4.2.4直方图 077
4.2.5折线图 078
4.2.6箱线图 079
4.2.7散点图 081
4.2.8相关系数图 083
4.3数据可视化进阶 084
4.3.1ggplot2 包 084
4.3.2交互可视化 090
4.4本章小结 094
4.5本章习题 094
参数估计与假设检验 96
5.1总体、样本和样本量 099
5.1.1总体 099
5.1.2样本 100
5.1.3统计量 100
5.2参数估计 101
5.2.1矩估计 101
5.2.2最大似然估计 102
5.2.3区间估计 104
5.3假设检验 109
5.3.1假设检验的基本步骤 109
5.3.2假设检验的p 值 112
5.3.3假设检验问题的基本类型 114
5.3.4正态总体的假设检验 115
5.4单因素方差分析 123
5.4.1单因素方差分析的基本思路
5.4.2实例分析 125
5.5本章小结 127
5.6本章习题 128
线性回归 129
6.1模型形式 133
6.2模型理解 134
6.2.1回归系数的理解 134
6.2.2定性变量转换及回归系数理解 135
6.2.3交互项的解读 136
6.2.4σ2 的理解 136
6.3基本假定 136
6.4回归参数的估计 138
6.4.1普通最小二乘估计 138
6.4.2最大似然估计 139
6.5假设检验 139
6.5.1回归系数的t 检验 140
6.5.2回归方程的F 检验 140
6.6模型评价 141
6.7回归诊断 141
6.7.1异方差 142
6.7.2强影响点 143
6.7.3多重共线性 143
6.7.4正态性 144
6.8变量选择 144
6.8.1逐步回归法 144
6.8.2信息准则 145
6.9模型实现 146
6.9.1 R语言中的基本函数 146
6.9.2 实例分析 147
6.10小结 154
6.11本章习题 154
逻辑回归 155
7.1模型形式 159
7.2模型估计 160
7.2.1参数估计 160
7.3模型评价 161
7.3.1准确率、精确率及召回率 162
7.3.2ROC 曲线和AUC值 163
7.4实例分析 164
7.5本章小结 167
7.6本章习题 167
降维分析 169
8.1主成分分析 172
8.1.1主成分分析原理 172
8.1.2主成分个数选择 174
8.1.3样本的主成分及主成分得分 175
8.1.4R语言中的主成分分析 176
8.2 因子分析 180
8.2.1 正交因子模型 180
8.2.2 模型估计 181
8.2.3因子得分 187
8.2.4因子分析和主成分分析的异同
8.2因子分析 180
8.2.1正交因子模型 180
8.2.2模型估计 181
8.3小结 190
8.4本章习题 191

前言/序言

统计分析:以R语言为工具前言

几年前,在北京大学王汉生教授的鼓励下,笔者和团队的小伙伴带头创办了《R语千寻》这个介绍统计分析语言(R语言)的专栏。专栏开辟以来,受到众多读者的喜爱,我们也收到了一些意见和反馈。尽管专栏对R语言的知识体系介绍相对全面,但缺乏对统计分析知识的系统梳理及讲解,因此,我便产生了写这本书的想法。

随着大数据时代的到来,数据作为一种重要的资产,其价值日益彰显。让读者理解数据,掌

握描述数据的方法,并能够进行统计分析,是本书的价值所在。为了使统计分析知识易于理解,本书辅以大量案例进行讲解。本书适合相关学科本科二年级及以上学生、研究生,以及对数据分析及建模感兴趣的读者阅读。

全书共八章,第一章提纲挈领,介绍统计分析的基本步骤及R语言基础知识,第二章重点介

绍R语言中的数据管理及数据清洗相关知识,第三章、第四章介绍数据基本统计分析、描述分析及可视化方法,第五章讲解统计分析中的参数估计与假设检验,第六章到第八章介绍几个重要的统计模型,包括线性回归、逻辑回归、降维分析。对于所涵盖的统计分析知识,本书尽量以浅显易懂的方式介绍原理,并以R语言为工具,讲解实现方法。本书每一章都设置了习题,既包含原理的解读、证明,也包含实战练习。读者可访问以下在线网站或扫描二维码,回复8527,查看本书在线教辅材料:

https://xueningzhu.github.io/Statistical-Analysis-with-R/index.html

本书的完成要特别感谢北京大学王汉生教授及狗熊会团队全体成员。如果没有狗熊会研究团队的鼎力支持及王汉生教授的鼓励,本书不可能面世。感谢笔者所在的工作单位复旦大学 大数据学院为本书创作提供的良好环境。同时,特别感谢本书的创作团队成员(按姓氏拼音顺序):米汶权、任怡萌、张桂维,感谢这几位作者在本书的文字撰写、材料整理方面做出的贡献。

统计分析是一个广阔的领域,由于本人所学尚浅且水平有限,书中错误及不当之处难免,敬请读者朋友予以批评指正!