统计分析:以R语言为工具前言
几年前,在北京大学王汉生教授的鼓励下,笔者和团队的小伙伴带头创办了《R语千寻》这个介绍统计分析语言(R语言)的专栏。专栏开辟以来,受到众多读者的喜爱,我们也收到了一些意见和反馈。尽管专栏对R语言的知识体系介绍相对全面,但缺乏对统计分析知识的系统梳理及讲解,因此,我便产生了写这本书的想法。
随着大数据时代的到来,数据作为一种重要的资产,其价值日益彰显。让读者理解数据,掌
握描述数据的方法,并能够进行统计分析,是本书的价值所在。为了使统计分析知识易于理解,本书辅以大量案例进行讲解。本书适合相关学科本科二年级及以上学生、研究生,以及对数据分析及建模感兴趣的读者阅读。
全书共八章,第一章提纲挈领,介绍统计分析的基本步骤及R语言基础知识,第二章重点介
绍R语言中的数据管理及数据清洗相关知识,第三章、第四章介绍数据基本统计分析、描述分析及可视化方法,第五章讲解统计分析中的参数估计与假设检验,第六章到第八章介绍几个重要的统计模型,包括线性回归、逻辑回归、降维分析。对于所涵盖的统计分析知识,本书尽量以浅显易懂的方式介绍原理,并以R语言为工具,讲解实现方法。本书每一章都设置了习题,既包含原理的解读、证明,也包含实战练习。读者可访问以下在线网站或扫描二维码,回复8527,查看本书在线教辅材料:
https://xueningzhu.github.io/Statistical-Analysis-with-R/index.html
本书的完成要特别感谢北京大学王汉生教授及狗熊会团队全体成员。如果没有狗熊会研究团队的鼎力支持及王汉生教授的鼓励,本书不可能面世。感谢笔者所在的工作单位复旦大学 大数据学院为本书创作提供的良好环境。同时,特别感谢本书的创作团队成员(按姓氏拼音顺序):米汶权、任怡萌、张桂维,感谢这几位作者在本书的文字撰写、材料整理方面做出的贡献。
统计分析是一个广阔的领域,由于本人所学尚浅且水平有限,书中错误及不当之处难免,敬请读者朋友予以批评指正!