本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
考虑大数据技术背景,本书结合实际用例介绍了应用Apache Storm和Apache Spark进行实时大数据分析的实现过程,为读者提供了快速设计、应用和部署实时分析所需的技术。
萨米特·古普塔、希尔皮·萨克塞纳著张广骏译
的《实时大数据分析(基于Storm\\Spark技术的实时应
用)》详细阐述了实时大数据分析的实现过程,主要
包括大数据技术前景及分析平台;熟悉Storm平台;
用Storm处理数据;Trident介绍和Storm性能优化;
熟悉Kinesis;熟悉Spark;RDD编程;Spark的SQL查
询引擎;Spark Streaming分析流数据以及Lambda架
构等内容。此外,本书还提供了相应的示例、代码,
以帮助读者进一步理解相关方案的实现过程。
本书适合作为高等院校计算机及相关专业的教材
和教学参考书,也可作为相关开发人员的自学教材和
参考手册。
无
第1章 大数据技术前景及分析平台
1.1 大数据的概念
1.2 大数据的维度范式
1.3 大数据生态系统
1.4 大数据基础设施
1.5 大数据生态系统组件
1.5.1 构建业务解决方案
1.5.2 数据集处理
1.5.3 解决方案实施
1.5.4 呈现
1.6 分布式批处理
1.7 分布式数据库(NoSQL)
1.7.1 NoSQL数据库的优势
1.7.2 选择NoSQL数据库
1.8 实时处理
1.8.1 电信或移动通信场景
1.8.2 运输和物流
1.8.3 互联的车辆
1.8.4 金融部门
1.9 本章小结
第2章 熟悉Storm
2.1 Storm概述
2.2 Storm的发展
2.3 Storm的抽象概念
2.3.1 流
2.3.2 拓扑
2.3.3 Spout
2.3.4 Bolt
2.3.5 任务
2.3.6 工作者
2.4 Storm的架构及其组件
2.4.1 Zookeeper集群
2.4.2 Storm集群
2.5 如何以及何时使用Storm
2.6 Storm的内部特性
2.6.1 Storm的并行性
2.6.2 Storm的内部消息处理
2.7 本章小结
第3章 用Storm处理数据
3.1 Storm输入数据源
3.2 认识Kafka
3.2.1 关于Kafka的 多知识
3.2.2 Storm的其他输入数据源
3.2.3 Kafka作为输入数据源
3.3 数据处理的可靠性
3.3.1 锚定的概念和可靠性
3.3.2 Storm的acking框架
3.4 Storm的简单模式
3.4.1 联结
3.4.2 批处理