Flink概述

是一个框架和分布式处理引擎，用于对无界和有界数据流进行有状态计算。
官网：Flink

Flink起源于一个叫作Stratosphere的项目，它是由3所地处柏林的大学和欧洲其他一些大学在2010~2014年共同进行的研究项目，由柏林理工大学的教授沃克尔·马尔科(Volker Markl)领衔开发。2014年4月，Stratosphere的代码被复制并捐赠给了Apache软件基金会，Flink就是在此基础上被重新设计出来的。
在德语中，“flink”’一词表示“快速、灵巧”。
项目的logo是一只彩色的松鼠。（如下图）
2014年8月，Flimnk第一个版本0.6正式发布，与此同时Fink的几位核心开发者创办Data Artisans公司；
2014年12月，Flink项目完成孵化；
2015年4月，Flink发布了里程碑式的重要版本0.9.0；
2019年1月，长期对Flink投入研发的阿里巴巴，以9000万欧元的价格收购了Data Artisans公司；
2019年8月，阿里巴巴将内部版本Blink开源，合并入Flink1.9.0版本。

处理数据的目标：低延迟、高吞吐、结果的准确性和良好的容错性。

故障自动重试；
一致性检查点；
保证故障场景下精确一次的状态一致性。（Flink提供了事件时间(event-time)和处理时间(processing-time)语义。对于乱序事件流，事件时间语义仍然能提供一致且准确的结果。）

本身高可用的设置，加上与K8S，YARN和Mesos的紧密集成，再加上从故障中快速恢复和动态扩展任务的能力，Flink能做到以极少的停机时间7x24全天候运行。

在这里插入图片描述

有状态流处理:通过底层API(处理函数)，对最原始数据加工处理。底层API与DataStream API相集成，可以处理复杂的计算。
DataStream API(流处理)和DataSet API(批处理)封装了底层处理函数，提供了通用的模块，比如转换(transformations，包括map、flatmap等)，连接(joins)，聚合(aggregations)，窗口(windows)操作等。注意:Flink1.12以后，DataStream
API已经实现真正的流批一体，所以DataSet API已经过时。
Table API是以表为中心的声明式编程，其中表可能会动态变化。Table API遵循关系模型:表有二维数据结构，类似于关系数据库中的表;同时API提供可比较的操作，例如select、project、join、group-by、aggregate等。我们可以在表与DataStream/Dataset 之间无缝切换，以允许程序将Table API与DataStream以及DataSet混合使用。
SQL这一层在语法与表达能力上与 Table API类似，但是是以SQL查询表达式的形式表现程序。SQL抽象与Table
API交互密切，同时SOL查询可以直接在Table API定义的表上执行。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/272616.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！