Flink的官网简述
作者:互联网
1、flink-无界数据集-有界数据集
-
针对无界数据持久化计算
数据源源不断产生的,就是流水一样。 -
数据类型
无界:不断产生数据
有界:最终,不再改变的数据集
2、flink-两种执行模型
- 执行模型
两种执行模型分别是:流计算、批处理
流计算:数据不断产生,就一直处于计算状态
批处理:完成一定时间段的计算任务后,释放资源
3、flink的特征
- 结果准确,即使是无序数据或者延迟达到的数据
- 有状态以及容错,维护精准一次应用状态
- 大规模计算,几千台节点运算,高吞吐和低延迟的特点
- flink通过检查机制实现精准一次的计算保证,在故障时可以提现出来。
- flink支持流计算以及窗口化操作
- flink灵活的基础时间的窗口计算
- flink容错是轻量级的,保证零数据丢失
4、flink-流计算模型、有界数据集处理
- 有界数据集是无界数据集的一个特例
- 有界数据集在flink内部是以一种终态数据集进行处理的。
- 在flink中,有界和无界的差别非常小。
- 使用同一套流计算执行引擎上的API操作两种数据类型。
总结:
开源流计算引擎,消除了性能和可靠性的权衡,鱼和熊掌可以兼得
标签:flink,模型,Flink,数据类型,无界,简述,计算,官网,数据 来源: https://blog.csdn.net/weixin_39868387/article/details/104661965