作 者:朱建平,富,谢邦昌,马双鸽,张德富,方匡南,潘璠 著
定 价:98
出 版 社:北京大学出版社
出版日期:2019年09月01日
页 数:408
装 帧:简装
ISBN:9787301307106
●第一章 大数据下的统计理论体系1.1 背景与意义1.2 文献回顾与评述1.3 大数据及其对统计学科的影响1.4 从统计学到数据科学范式的兴起1.5 大数据背景下的统计学科建设1.6 总结与展望参考文献第二章 大数据下的数据集整合分析2.1 背景和意义2.2 综述2.3 AFT在异构性模型的整合分析2.4 对癌症结果中多维度组学数据的整合分析2.5 多亚型癌症预后数据整合分析2.6 基于对比惩罚的高通量癌症研究整合分析2.7 总结与展望参考文献第三章 大数据下的高维变量选择方法3.1 背景和意义3.2 高维数据的群组变量选择方法3.3 基于自适应稀疏组Lasso的双层变量选择3.4 基于网络结构Logistic模型的企业信用风险预警3.5 用惩罚方法来识别两部分模型的比例结构3.6 总结与展望参考文献第四章 大数据下的统计方法并行计算4.1 背景和意义4.2 综述4.3 基于Map-Reduce的马尔可夫毯贝叶斯网络学习4.4 基于Hadoop的并行关联规则挖掘方法4.5 基于分类问题的特征排序算法4.6 模糊时间序列预测模型4.7 精准营销决策框架4.8 总结及展望参考文献第五章 大数据下的统计方法应用——网络舆情分析5.1 背景和意义5.2 网络舆情分析研究方法5.3 网络舆情分析中的主题发现5.4 网络舆情分析中的关联分析5.5 网络舆情分析中的情感倾向性分析5.6 应用研究5.7 总结与展望参考文献
从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。 《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下的高维变量选择方法、大数据下的统计方法并行计算和大数据下的统计方法应用——网络舆情分析。 本书内容新颖,取材国内外资料,同时认真总结了作者近年来的科研成果,重点反映统计学对大数据发展的影响,突出五大特点: &n等
朱建平,富,谢邦昌,马双鸽,张德富,方匡南,潘璠 著
朱建平,南开大学理学博士。现为厦门大学管理学院教授、博士生导师,厦门大学健康医疗大数据国家研究院副院长,厦门大学数据挖掘研究中心主任。主要研究方向为数理统计、数据挖掘、健康医疗大数据、数据科学与商业智能等。 谢邦昌,台湾大学生物统计学博士。现为台北医学大学教授、博士生导师,台北医学大学管理学院院长、台北医学大学大资料研究中心主任。主要研究方向为数理统计、生物统计、统计调查研究、大数据挖掘、医学统计等。 马双鸽,美国威斯康星大学统计学博士、华盛顿大学生物统计等