《基于Apache Flink的流处理》求取 ⇩
作者 | (美)比安·霍斯克(Fabian Hueske) 编者 |
---|---|
出版 | 未查询到或未知 |
参考页数 | ✅ 真实服务 非骗流量 ❤️ |
出版时间 | 2020(求助前请核对) 目录预览 |
ISBN号 | 无 — 违规投诉 / 求助条款 |
PDF编号 | 820162538(学习资料 勿作它用) |
求助格式 | 扫描PDF(若分多册发行,每次仅能受理1册) |
前言1
第1章状态化流处理概述7
传统数据处理架构8
事务型处理8
分析型处理9
状态化流处理11
事件驱动型应用13
数据管道14
流式分析15
开源流处理的演变16
历史回顾17
Flink快览18
运行首个Flink应用20
小结23
第2章流处理基础25
Dataflow编程概述25
Dataflow图25
数据并行和任务并行26
数据交换策略27
并行流处理28
延迟和吞吐28
数据流上的操作31
时间语义36
流处理场景下一分钟的含义37
处理时间38
事件时间39
水位线40
处理时间与事件时间41
状态和一致性模型41
任务故障43
结果保障44
小结46
第3章Apache Flink架构47
系统架构47
搭建Flink所需组件48
应用部署50
任务执行51
高可用性设置52
Flink中的数据传输54
基于信用值的流量控制56
任务链接57
事件时间处理58
时间戳59
水位线59
水位线传播和事件时间61
时间戳分配和水位线生成63
状态管理64
算子状态65
键值分区状态66
状态后端68
有状态算子的扩缩容68
检查点、保存点及状态恢复71
一致性检查点71
从一致性检查点中恢复72
Flink检查点算法74
检查点对性能的影响79
保存点79
小结82
第4章设置Apache Flink开发环境83
所需软件83
在IDE中运行和调试Flink程序84
在IDE中导入书中示例84
在IDE中运行Flink程序87
在IDE中调试Flink程序88
创建Flink Maven项目89
小结90
第5章DataStream API(1.7版本)91
Hello, Flink!91
设置执行环境93
读取输入流94
应用转换94
输出结果95
执行96
转换操作96
基本转换97
基于KeyedStream的转换100
多流转换104
分发转换108
设置并行度111
类型112
支持的数据类型113
为数据类型创建类型信息116
显式提供类型信息117
定义键值和引用字段118
字段位置118
字段表达式119
键值选择器120
实现函数121
函数类121
Lambda函数122
富函数123
导入外部和Flink依赖124
小结125
第6章基于时间和窗口的算子127
配置时间特性127
分配时间戳和生成水位线129
水位线、延迟及完整性问题133
处理函数134
时间服务和计时器136
向副输出发送数据138
CoProcessFunction140
窗口算子141
定义窗口算子142
内置窗口分配器143
在窗口上应用函数148
自定义窗口算子155
基于时间的双流Join167
基于间隔的Join167
基于窗口的Join168
处理迟到数据170
丢弃迟到事件170
重定向迟到事件171
基于迟到事件更新结果172
小结174
第7章有状态算子和应用175
实现有状态函数176
在RuntimeContext中声明键值分区状态176
通过ListCheckpointed接口实现算子列表状态180
使用CheckpointedFunction接口187
接收检查点完成通知189
为有状态的应用开启故障恢复190
确保有状态应用的可维护性190
指定算子唯一标识191
为使用键值分区状态的算子定义最大并行度192
有状态应用的性能及鲁棒性192
选择状态后端193
选择状态原语194
防止状态泄露195
更新有状态应用198
保持现有状态更新应用199
从应用中删除状态200
修改算子的状态200
可查询式状态202
可查询式状态服务的架构及启用方式203
对外暴露可查询式状态204
从外部系统查询状态205
小结207
第8章读写外部系统209
应用的一致性保障210
幂等性写211
事务性写211
内置连接器213
Apache Kafka数据源连接器214
Apache Kafka数据汇连接器218
文件系统数据源连接器222
文件系统数据汇连接器224
Apache Cassandra数据汇连接器228
实现自定义数据源函数232
可重置的数据源函数233
数据源函数、时间戳及水位线235
实现自定义数据汇函数236
幂等性数据汇连接器238
事务性数据汇连接器239
异步访问外部系统248
小结251
第9章搭建Flink运行流式应用253
部署模式253
独立集群254
Docker256
Apache Hadoop YARN258
Kubernetes261
高可用性设置266
独立集群的HA设置267
YARN上的HA设置268
Kubernetes的HA设置270
集成Hadoop组件270
文件系统配置272
系统配置274
Java和类加载275
CPU275
内存和网络缓冲276
磁盘存储278
检查点和状态后端279
安全性280
小结281
第10章Flink和流式应用运维283
运行并管理流式应用283
保存点284
通过命令行客户端管理应用285
通过REST API管理应用292
在容器中打包并部署应用298
控制任务调度302
控制任务链接302
定义处理槽共享组303
调整检查点及恢复305
配置检查点306
配置状态后端309
配置故障恢复311
监控Flink集群和应用313
Flink Web UI313
指标系统316
延迟监控322
配置日志行为323
小结324
第11章还有什么?325
Flink生态的其他组成部分325
用于批处理的DataSet API325
用于关系型分析的Table API及SQL326
用于复杂事件处理和模式匹配的FlinkCEP326
用于图计算的Gelly327
欢迎加入社区327
2020《基于Apache Flink的流处理》由于是年代较久的资料都绝版了,几乎不可能购买到实物。如果大家为了学习确实需要,可向博主求助其电子版PDF文件。对合法合规的求助,我会当即受理并将下载地址发送给你。
高度相关资料
- 地基处理
- 1997 北京市:中国建筑工业出版社
- 地基处理
- 1997 成都:西南交通大学出版社
- 难处理地基的基础工程
- 1982 水利出版社
- 热处理基础
- 1986 哈尔滨:黑龙江科学技术出版社
- 微处理机基础
- 1981 北京:科学技术文献出版社;重庆分社
- 基于MATLAB的系统分析与设计 1 信号处理
- 1998 西安:西安电子科技大学出版社
- 普通生态学 原理、方法和应用
- 1994 上海:复旦大学出版社
- Apache Server系统管理员手册
- 1999 北京:电子工业出版社
- 地基处理手册
- 1988 北京:中国建筑工业出版社
- 软土地基处理
- 1995 北京:中国铁道出版社
- 基础及土木结构
- 1984 北京:中国铁道出版社
- 产后流血的预防及处理
- 1961 北京:人民卫生出版社
- 于无声处
- 1979 上海:上海人民美术出版社
提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。➥ PDF文字可复制化或转WORD