Flink笔记(二十)：Flink 之 State 状态介绍

Rosine ·

更新时间:2024-11-13

· 590 次阅读

1.State介绍

Flink 架构体系的一大特性是：有状态计算。

有状态计算：任务执行过程中，会存储计算过程中产生的中间结果，并提供后续的 Function 或算子计算结果使用状态：任务内部数据（计算数据和元数据属性）的快照。在计算过程中会进行持久化，保存有任务中间计算结果的数据。 2.State作用

1、实时任务每次计算，需要基于上一次计算结果，所以需要通过 State 将任务每次计算的中间结果进行持久化。

2、任务执行出现错误时，需要从成功的检查点（CheckPoint）中，根据 State 数据进行恢复

3、Flink 增量计算、Failover 机制等，都需要 State 的支撑。

3.State存储实现

1.基于JobManager内存的 HeapStateBackend：在 debug 模式下使用，不建议在生产环境使用；

2.基于 HDFS 的 FsStateBackend：分布式文件持久化，每次读写都产生网络 IO，整体性能不佳；

3.基于RocksDB 的 RocksDBStaeBackend：本地文件+异步HDFS持久化；

4.还有一个是基于 Niagara（Alibaba 内部实现）NiagaraStateBackend：分布式持久化，在Alibaba 生产环境应用。

提示：此部分内容，同 Flink笔记(十八)：Flink 之 StateBackend 介绍 & 使用

4.State分类

State 按照是否根据 KeyBy() 分组操作，可以分为 KeyedState 和 OperatorState。两者都支持并行度发生变化时，进行状态数据的重新分配。

4.1 KeyedState

KeyedState 是与 Key 相关的一种 State，只能用于 KeyedStream 类型数据集对应的 Transformation 算子操作之上。

KeyedState 是 OperatorState 的特例。区别是 KeyedState 事先按照 Key 对数据进行分区，每个 KeyState 仅对应一个 Key（即：分组之后，每个组都会有一个 KeyedState 用于状态数据存储）

4.2 OperatorState

OperatorState 只与 Transformation 算子实例绑定，每个算子实例中持有所有数据元素中的一部分状态数据

5.KeyedState 和 OperatorState 图示

场景： Flink 从 Kafka 集群中读取数据(读取到的是一行一个单词)，并对读取到的数据进行 KeyBy() 分组求和操作。本例集群配置为：Flink集群 2 个TaskManager，4 个Slot，任务开启4个并行度。Kafka集群 4 个分区。

1.整体图：
在这里插入图片描述
2.Slot && Task关系图：

一个 Slot 可以有多个 subTask，每个 subTask 中执行 keyBy()操作后，又会分成多个组。分组前为 OperatorState,分组后为KeyedState。每个组中都会各自存储一个 KeyedState，保存有当前分组中的中间数据。
在这里插入图片描述

6.OperatorState、KeyedState 的使用

请参考：

Flink 之 OperatorState的使用 Flink 之 KeyedState 的使用
Flink 之 State 状态，介绍到此为止

文章都是博主用心编写，如果本文对你有所帮助，那就给我点个赞呗 ^ _ ^

End

作者：扛麻袋的少年

state flink

1024 个赞

编辑举报

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

SQL DEFAULT 约束

Pythia 2020-02-24

749

浅谈Docker数据持久化

Jayne 2021-06-29

988

vuex获取state对象中值的所有方法小结(module中的state)

Florence 2022-10-19

498

vue从仓库state中取不到数据的问题

Ailis 2022-10-19

1564

解决vue页面刷新vuex中state数据丢失的问题

Galatea 2022-10-25

390

ApacheHudi结合Flink的亿级数据入湖实践解析

Vera 2022-10-26

1019

vuex新手进阶篇之改变state mutations的使用

Anne 2022-11-05

191

Vuex拿到state中数据的3种方式与实例剖析

Oria 2022-11-06

1839

使用react在修改state中的数组和对象数据的时候(setState)

Hazel 2022-11-06

862

React 保留和重置State

Penny 2022-11-06

860

Vuex中如何getters动态获取state的值

Wanda 2022-11-06

319

vuex中能直接修改state吗

Irene 2022-11-09

1162

React在组件中如何监听redux中state状态的改变

Bonnie 2022-11-09

728

react中(含hooks)同步获取state值的方式

Hana 2022-11-09

1730

React事件监听和State状态修改方式

Heather 2022-11-09

558

React组件三大属性之state,props,refs

Caroline 2022-11-09

64

详解Flink同步Kafka数据到ClickHouse分布式表

Tertia 2022-12-03

2

Flutter交互并使用小工具管理其状态widget的state详解

Kande 2022-12-23

996

Vuex给state中的对象新添加属性遇到的问题及解决

Miette 2023-01-11

1258

基于FLink实现实时安全检测的示例代码

Kita 2023-02-24

1129

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。
软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座