SparkStreaming实时流式大数据处理实战 pdf下载pdf下载

SparkStreaming实时流式大数据处理实战百度网盘pdf下载

作者:
简介:本篇提供书籍《SparkStreaming实时流式大数据处理实战》百度网盘pdf下载
出版社:出版集团图书专营店
出版时间:2019-05
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

基本信息

  • 商品名称:Spark Streaming实时流式大数据处理实战
  • 作者:编者:肖力涛
  • 定价:69
  • 出版社:机械工业
  • ISBN号:9787111624325

其他参考信息(以实物为准)

  • 出版时间:2019-05-01
  • 印刷时间:2019-05-01
  • 版次:1
  • 印次:1
  • 开本:16开
  • 包装:平装
  • 页数:233

目录

前言
第1篇 Spark基础
第1章 初识Spark
1.1 Spark由来
1.2 流式处理与Spark Streaming
1.2.1 流式处理框架
1.2.2 Spark Streaming初识
1.2.3 Structed Streaming简述
1.3 本章小结
第2章 Spark运行与开发环境
2.1 Spark的下载与安装
2.2 Spark运行模式
2.2.1 本地模式
2.2.2 本地集群模式
2.2.3 Standalone模式
2.2.4 Spark On Yarn模式
2.2.5 Spark On Mesos模式
2.3 搭建开发环境
2.3.1 修改配置
2.3.2 启动集群
2.3.3 IDE配置
2.3.4 UI监控界面
2.4 实例——Spark文件词频统计
2.5 本章小结
第3章 Spark编程模型
3.1 RDD概述
3.2 RDD存储结构
3.3 RDD操作
3.3.1 Transformation操作
3.3.2 Action操作
3.4 RDD间的依赖方式
3.4.1 窄依赖(Narrow Dependency)
3.4.2 Shuffle依赖(宽依赖Wide Dependency)
3.5 从RDD看集群调度
3.6 RDD持久化(Cachinng/Persistence)
3.7 共享变量
3.7.1 累加器(Accumulator)
3.7.2 广播变量(Broadcast Variables)
3.8 实例——Spark RDD操作
3.9 本章小结
第2篇 Spark Streaming详解
第4章 Spark Streaming编程模型及原理
4.1 DStream数据结构
4.2 DStream操作
4.2.1 DStream Transformation操作
4.2.2 DStream输出操作
4.3 Spark Streaming初始化及输入源
4.3.1 初始化流式上下文(StreamingContext)
4.3.2 输入源及接收器(Receivers)
4.4 持久化、Checkpointing和共享变量