大数据flink篇之一-基础知识

大数据flink篇之一-基础知识

news/2024/12/23 22:33:48/文章来源:https://blog.csdn.net/a18852867035/article/details/133278173

一、起源

2010至2014年间，由柏林工业大学、柏林洪堡大学和哈索普拉特纳研究所联合发起名Stratosphere的研究项目。
2014年4月，项目贡献给Apache基金会，成为孵化项目。更名为Flink
2014年12月，成为基金会顶级项目
2015年9月，发布第一个稳定版本0.9
Flink1.7，第一个完全支持Scala2.12 -2018年
最新-Flink1.17
后续版本flink持续更新中，后续我们的案例以flink1.15来实现

二、简介

定义：Apache Flink是一个分布式处理引擎，用于对无界和有界流进行有状态处理。
优点：低延迟、高吞吐、结果的准确性和良好的容错性
重点关键词：分布式、无界和有界、状态处理

解释：
分布式：运算过程分布在不同的节点甚至机器进行。
有界与无界:在flink的世界观众，一切都是流。有界只是流指定了起点和终点，数据是固定的；无界则数据源源不断的产生，没有结束边界。
在这里插入图片描述

三、用途

用途十分广泛，如：

电商和市场营销
数据报表、广告投放、业务流程需要
物联网（IOT）
传感器实时采集和显示、实时报警，交通运输业
电信业
基站流量调配
银行和金融业
实时结算和通知推送，实时监测异常行为
其它应用：实时数仓和ETL、复杂事件处理

四、Flink的特点和优势

分层API
底层的状态操作、ProcessFunction等（属于大招）
中间层：流API操作，窗口等操作。
顶层：Table和SQL API

顶层API一直在完善中，一般使用中间层就足够了，特殊需求需要使用底层API。
事件驱动
由一个事件驱动，周期性地保存磁盘（checkpoint），计算结果可以持久化到外部设备。即来一条处理一条
传统的事务应用（如Web应用）也是一种事件驱动型。
基于流的世界观
此特点上述过程已叙述。

Flink的具体优势：

时间语义丰富：支持事件时间（event-time）和处理时间（process-time）、注入时间（IngestionTime）
精确一次（exactly-once）的状态一致性保证。
低延迟，每秒处理几百万
高可用，7*24不间断运行
与多个存储介质兼容（Kafka/ES/Hive/Mysql）

下一篇以应用实例来进行讲解

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/141504.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

02 MIT线性代数-矩阵消元 Elimination with matrices

02 MIT线性代数-矩阵消元 Elimination with matrices

一, 消元法 Method of Elimination 消元法是计算机软件求解线形方程组所用的最常见的方法。任何情况下，只要是矩阵A可逆，均可以通过消元法求得Axb的解 eg: 我们将矩阵左上角的1称之为“主元一”（the first pivot），第…

阅读更多...

算法-贪心+优先级队列-IPO

算法-贪心+优先级队列-IPO

算法-贪心优先级队列-IPO 1 题目概述 1.1 题目出处 https://leetcode.cn/problems/ipo/description/?envTypestudy-plan-v2&envIdtop-interview-150 1.2 题目描述 2 回溯法 2.1 思路 2.2 代码 class Solution {int result 0;public int findMaximizedCapital(int …

阅读更多...

【C语言】进阶——结构体+枚举+联合

【C语言】进阶——结构体+枚举+联合

①前言： 在之前【C语言】初阶——结构体 ，简单介绍了结构体。而C语言中结构体的内容还有更深层次的内容。一.结构体结构体(struct)是由一系列具有相同类型或不同类型的数据项构成的数据集合，这些数据项称为结构体的成员。 1.结构体的声明 …

阅读更多...

[LLM+AIGC] 01.应用篇之中文ChatGPT初探及利用ChatGPT润色论文对比浅析（文心一言 | 讯飞星火）

[LLM+AIGC] 01.应用篇之中文ChatGPT初探及利用ChatGPT润色论文对比浅析（文心一言 | 讯飞星火）

近年来，人工智能技术火热发展，尤其是OpenAI在2022年11月30日发布ChatGPT聊天机器人程序，其使用了Transformer神经网络架构（GPT-3.5），能够基于在预训练阶段所见的模式、统计规律和知识来生成回答&#xff0c…

阅读更多...

pytest之parametrize()实现数据驱动

pytest之parametrize()实现数据驱动

第一个参数是字符串，多个参数中间用逗号隔开第二个参数是list,多组数据用元组类型;传三个或更多参数也是这样传。list的每个元素都是一个元组，元组里的每个元素和按参数顺序一一对应传一个参数 pytest.mark.parametrize(‘参数名’，list)…

阅读更多...

CMU15-213 课程笔记 04-Floating Point

CMU15-213 课程笔记 04-Floating Point

文章目录浮点数如何用二进制表示IEEE 浮点数标准IEEE 浮点数实现IEEE 浮点数在内存里 E exp - bias 计算指数M 1.xxx 尾数计算举例：对一个浮点数进行转换一些关于浮点数的计算等等浮点数如何用二进制表示计算机内部的浮点数不是这样存在内存里的（至…

阅读更多...

【RabbitMQ实战】05 RabbitMQ后台管理

【RabbitMQ实战】05 RabbitMQ后台管理

一、多租户与权限 1.1 vhost的概念每一个 RabbitMQ服务器都能创建虚拟的消息服务器，我们称之为虚拟主机(virtual host),简称为 vhost。每一个 vhost本质上是一个独立的小型RabbitMQ服务器，拥有自己独立的队列、交换器及绑定关系等，并且它拥…

阅读更多...

知识储备--基础算法篇-贪心算法

知识储备--基础算法篇-贪心算法

1.贪心算法 1.1贪心算法与背包问题的区别贪心算法能够通过局部最优去推出全局最优，而背包问题不行，需要用动态规划的方法来解决。 1.2套路贪心算法没有套路！！ 主要想清楚怎么得到该阶段的局部最优解，如何通过局…

阅读更多...

spring的ThreadPoolTaskExecutor装饰器传递调用线程信息给线程池中的线程

spring的ThreadPoolTaskExecutor装饰器传递调用线程信息给线程池中的线程

概述需求是想在线程池执行任务的时候，在开始前将调用线程的信息传到子线程中，在子线程完成后，再清除传入的数据。下面使用了spring的ThreadPoolTaskExecutor来实现这个需求. ThreadPoolTaskExecutor 在jdk中使用的是ThreadPoolExecutor…

阅读更多...

前端web常用的基础案例

前端web常用的基础案例

html案例： <!DOCTYPE html> <html> <head><title>My Website</title> </head> <body><header><h1>Welcome to My Website</h1><nav><ul><li><a href"#">Home</a…

阅读更多...

阿里云效自动构建python自动测试脚本

阿里云效自动构建python自动测试脚本

之前一直用的是jenkins自动构建自动化脚本，因为现在的公司统一在阿里云效的流水线上做代码的管理，构建，要求自动化测试也在上面自动构建，故而学习了一下。为自己做一个记录，也给有需要的朋友做一个参考。 1. 新建流水…

阅读更多...

Mysql备份恢复、与日志管理

Mysql备份恢复、与日志管理

Mysql日志管理、备份与恢复一、Mysql日志管理1.1、日志分类1.1.1、错误日志1.1.2 、通用查询日志1.1.3、二进制日志1.1.4 、慢查询日志1.1.5 、配置日志 1.2、日志的查询二、备份与恢复2.1、数据备份的必要性2.2 、造成数据丢失的原因2.3、数据库备份的分类2.3.1、物理备…

阅读更多...

python 正则表达式

python 正则表达式

一、特殊字符-需要转义 eg：转义符： 待匹配的字符串：lr的值，及下图中字符串lr[和字符串，之间的数据正则写法： learning_rate re.findall(".*lr\[(.*?), *", content) 处理结果：…

阅读更多...

OpenCV实现模板匹配和霍夫线检测，霍夫圆检测

OpenCV实现模板匹配和霍夫线检测，霍夫圆检测

一，模板匹配 1.1代码实现 import cv2 as cv import numpy as np import matplotlib.pyplot as plt from pylab import mplmpl.rcParams[font.sans-serif] [SimHei]#图像和模板的读取 img cv.imread("cat.png") template cv.imread(r"E:\All_in\o…

阅读更多...

Learn Prompt- Midjourney Prompt:Prompt 提示语

Learn Prompt- Midjourney Prompt:Prompt 提示语

基础结构一个基本的提示可以简单到一个单词、短语或表情符号。非常短的提示将在很大程度上依赖于 Midjourney 的默认样式。完整 prompt：可以包括一个或多个图像链接、多个文本短语或单词，以及一个或多个后缀参数 Image Prompts: 可以将图像 URL 添加…

阅读更多...

github代码提交过程详细介绍

github代码提交过程详细介绍

1、下载github上面的代码 （1）在github网站上，找到想要下载的代码仓库界面，点击Code选项就可以看到仓库的git下载地址； （2）使用命令下载：git clone 地址； 2、配置本地git…

阅读更多...

中国制造让苹果跪服，将再增加一家中国高科技供应商

中国制造让苹果跪服，将再增加一家中国高科技供应商

日前产业链人士指出由于京东方的OLED面板有力地制衡韩国面板厂商三星和LGD，促使他们降价，而且技术也不错，因此正计划再引入一家中国OLED面板厂商，以进一步促进OLED面板的竞争。早期苹果的OLED面板完全由三星供应，由此…

阅读更多...

什么是AI问答机器人？它的应用场景有哪些？

什么是AI问答机器人？它的应用场景有哪些？

近年来，由于技术的进步和对个性化客户体验的需求不断增长，AI问答机器人也是获得了巨大的关注。AI问答机器人，也被称为AI聊天机器人，是一种旨在模拟人类对话并通过基于文本或语音的界面与用户交互的计算机程序。其能够自动执行各种…

阅读更多...

Java-day17(反射)

Java-day17(反射)

Reflection(反射) 动态语言的关键允许程序在执行期借助于Reflection API取得任何类的内部信息，并能直接操作任意对象的内部属性及方法提供的功能: 在运行时判断任意一个对象所属类在运行时构造任意一个类的对象在运行时判断任意一个类所具有的成员变量和方法在…

阅读更多...

分享从零开始学习网络设备配置--任务3.7 使用动态路由RIPv2实现网络连通

分享从零开始学习网络设备配置--任务3.7 使用动态路由RIPv2实现网络连通

任务描述某公司随着规模的不断扩大，路由器的数量开始有所增加。网络管理员发现原有的静态路由已经不适合现在的公司，实施动态路由RIPv2协议配置，实现网络中所有主机之间互相通信。在路由器较多的网络环境中，手工配置静态路由…

阅读更多...

最新文章

推荐文章