本篇主要提供深入理解Flink核心设计与实践原理电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
讲解Flink的多种部署方式——单机部署、Standalone模式部署、YARN模式部署及相应的高可用设置。
分析Flink分布式开发的基础概念、Flink的流处理开发的基本功能,包括读取数据和输出数据,以及对数据流进行各种转换操作等,同时还讲解如何对开发的Flink应用程序进行本地测试。
讲解Flink在流处理开发中对有状态计算的支持,包括检查点机制、保存点机制、各种状态后端等。
讲解Flink在流处理开发中的高级功能,如窗口操作、时间处理、连接操作、侧端输出操作,以及自定义数据源和自定义数据接收器,同时讲解Apache Kafka连接器对数据源和数据接收器的支持。
介绍Flink在批处理开发中的基本操作,包括读取数据和输出数据,以及对数据集进行的各种转换操作等。
介绍Flink的Table API和SQL如何统一流处理和批处理,以及Table API和SQL在流处理中的一些特别情况,包括动态表、时间属性和时态表等。
介绍Flink中部署程序的基本操作,包括配置程序的执行参数、程序的并行度、程序的重启策略、发布程序的方式等。
本书从Apache Flink的缘起开始,由浅入深,理论结合实践,全方位地介绍Apache Flink这一处理海量数据集的高性能工具。本书围绕部署、流处理、批处理、Table API和SQL四大模块进行讲解,并详细说明Apache Flink的每个特性的实际业务背景,使读者不仅能编写可运行的Apache Flink程序代码,还能深刻理解并正确地将其运用到合适的生产业务环境中。虽然本书是以Apache Flink技术框架来讲解流计算技术的,但是流计算领域开发所面临的各种问题同样是Java后端开发者在进行服务端开发时所要面临的,如有状态计算、Exactly Once语义等。因此,Apache Flink框架为解决这些问题而设计的方案同样值得Java后端开发者借鉴。本书适合初级和中级软件工程师阅读,未接触过流计算领域的Java开发者也可以从本书中获益。针对初学者,本书提供Windows环境搭建的演示,使不具备Linux系统操作经验的读者也可以快速学习Apache Flink。
国家认证软件设计师,获得Apache Kylin管理员认证。现任某上市咨询公司高级咨询顾问,有多年大数据、流式计算方面的开发经验,对Hadoop、Strom、Flink等大数据计算引擎有着非常深入的理解,积累了丰富的项目实践经验。先后利用相关技术为银行、保险、能源等领域的头部企业解决业务痛点。个人技术博客:www.cnblogs.com/intsmaze个人Github项目:github.com/intsmaze