PowerJob 分布式任务调度简介

目录

适用场景

设计目标

 PowerJob 功能全景

任务调度

工作流

分布式计算

动态容器

什么是动态容器?

使用场景

可维护性和灵活性的完美结合

实时日志&在线运维

PowerJob 系统组件

PowerJob 应用场景

PowerJob 的优势


PowerJob(原OhMyScheduler)是全新一代分布式任务调度与计算框架,其主要功能特性如下

  • 使用简单:提供前端Web界面,允许开发者可视化地完成调度任务的管理(增、删、改、查)、任务运行状态监控和运行日志查看等功能。
  • 定时策略完善:支持 CRON 表达式、固定频率、固定延迟和API四种定时调度策略。
  • 执行模式丰富:支持单机、广播、Map、MapReduce 四种执行模式,其中 Map/MapReduce 处理器能使开发者寥寥数行代码便获得集群分布式计算的能力
  • 工作流支持:支持在线配置任务依赖关系(DAG),以可视化的方式对任务进行编排,同时还支持上下游任务间的数据传递,以及多种节点类型(判断节点 & 嵌套工作流节点)。
  • 执行器支持广泛:支持 Spring Bean、内置/外置 Java 类,另外可以通过引入官方提供的依赖包,一键集成 Shell、Python、HTTP、SQL 等处理器,应用范围广。
  • 运维便捷:支持在线日志功能,执行器产生的日志可以在前端控制台页面实时显示,降低 debug 成本,极大地提高开发效率。
  • 依赖精简:最小仅依赖关系型数据库(MySQL/PostgreSQL/Oracle/MS SQLServer...)
  • 高可用 & 高性能:调度服务器经过精心设计,一改其他调度框架基于数据库锁的策略,实现了无锁化调度。部署多个调度服务器可以同时实现高可用和性能的提升(支持无限的水平扩展)。
  • 故障转移与恢复:任务执行失败后,可根据配置的重试策略完成重试,只要执行器集群有足够的计算节点,任务就能顺利完成。

在线试用:在线试用 · 语雀

适用场景

  • 有定时执行需求的业务场景:如每天凌晨全量同步数据、生成业务报表、未支付订单超时取消等。
  • 有需要全部机器一同执行的业务场景:如使用广播执行模式清理集群日志。
  • 有需要分布式处理的业务场景:比如需要更新一大批数据,单机执行耗时非常长,可以使用Map/MapReduce 处理器完成任务的分发,调动整个集群加速计算。
  • 有需要延迟执行某些任务的业务场景:比如订单过期处理等。

设计目标

PowerJob 的设计目标为企业级的分布式任务调度平台,即成为公司内部的任务调度中间件。整个公司统一部署调度中心 powerjob-server,旗下所有业务线应用只需要依赖 powerjob-worker 即可接入调度中心获取任务调度与分布式计算能力。

 PowerJob 功能全景

任务调度

 丰富的调度策略和强大的调度能力。

  • 原生提供 CRON、固定频率、固定延迟三种最常见的调度策略。
  • 额外提供 OpenApi 作为扩展调度策略,允许接入方完成调度层的自定义需求。
  • 整个调度层采用无锁化设计,基于时间轮进行调度,低延迟,高性能。

工作流

为什么要支持工作流?它解决了什么业务问题?

工作流描述了任务与任务之间的依赖关系,比如我现在有 A、B、C、D 四个任务,我希望 A 任务运行完毕后才开始运行 B、C 任务,最后再运行 D 任务。这就形成了一个依赖关系,可以通过有向无环图(DAG)来描述这个关系,如下图所示。

 DAG 定义:在图论中,如果一个有向图无法从某个顶点出发,经过若干条边回到该顶点,则这个图是一个有向无环图。

利用 DAG 轻松解决任务间复杂依赖问题。

  • 支持上游任务结果传递。
  • 提供前端界面可视化绘图&结果展示。
  • 每个节点本身都是 PowerJob 的任务,因此可以享受任务的所有基础能力(故障转移、MR、在线运维、实时日志等)。

分布式计算

  • 调度框架为什么需要分布式计算?

实际业务场景中,我们会有比较复杂的离线任务,说白了还是数据处理任务,那么涉及到数据,就会有大数据量级的数据处理,所以我们需要用到分布式计算。

  • 即便需要,市面上已有众多现成的分布式计算框架,PowerJob 是在重复造轮子吗?

答案是不是,因为市面上基本都是基于数据的处理,缺乏基于业务的处理。所以 PowerJob 是处理业务方面的数据问题。

PowerJob 是基于 MapReduce 模型的创新实现。

分而治之,Map :拆分;Reduce 装。

比如:一个根任务拆分成多个子任务,派发给不同的机器,最后再把结果汇总。 

  • 海量业务数据处理的好帮手。
  • 寥寥数行代码实现分布式计算。
  • 支持任意层级子任务拆分(无限Map)。

动态容器

什么是动态容器?

PowerJob 的容器技术允许开发者开发独立于 worker 项目之外的 Java 处理器,简单来说,就是以Maven 工程项目的维度去组织一堆 Java 文件(众多任务处理器),进而兼具开发效率和可维护性。

使用场景

比如有某个数据库数据订正任务,与主业务无关,写进原本的项目工程中不太优雅。这时候就可以单独创建一个用于数据操作的容器,在里面完成处理器的开发,通过 PowerJob 动态容器技术在 worker 集群上被加载执行。

可维护性和灵活性的完美结合
  • 使用简单,提供一键模版生成功能(类似于 spring initializr ),真正的开箱即用。
  • 部署便捷,除了普通的上传 FatJar 部署方式外,额外支持 Git 源码部署,一站式完成编译、打包、部署和加载。
  • 开发高效,动态容器支持完整 Spring 特性,开发容器和开发普通 Spring 项目没有任何区别。

实时日志&在线运维

PowerJob 系统组件

所有组件均支持水平扩展。

  • powerjob-server:调度中心,整个公司内部统一部署,负责任务管理和调度。
  • powerjob-worker:执行器,提供单机执行、广播执行和分布式计算等功能。
  • powerjob-client:可选组件,OpenAPI客户端 。

PowerJob 应用场景

普通定时任务:比如生成业务报表等。

有需要全部机器执行同一任务的业务场景:比如清理日志。

有需要分布式处理的业务场景:比如需要更新一大批数据,单机执行耗时非常长,可以使用Map/MapReduce处理器完成任务的分发,调动整个集群加速计算。

有需要延迟执行某些任务的业务场景:比如订单过期处理。

PowerJob 的优势

功能强大,使用简单,文档齐全。

丰富的调度策略(CRON、固定频率、固定延迟、OpenAPI)。

支持工作流(workflow),可视化编排复杂任务依赖关系。

支持分布式计算,寥寥数行代码完成分布式计算。

依赖精简:最小依赖仅为关系型数据库,扩展依赖 MongoDB。

执行器支持广泛:Java、Shell、Python……

高可用& 高性能:所有组件均支持集群部署,水平扩展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/305302.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

无法用raven-js,如何直接使用TraceKit标准化错误字符串(一次有趣的探索)

引子:网上三年前(2020)的文章介绍了一个raven-js 简单说就是把堆栈信息格式化兼容各浏览器,便于查看错误来源。 **but:**到处找了一下raven-js,已经没有官方出处了,只在Sentry的源码仓库里发现…

Docker使用— Docker部署安装Nginx

Nginx简介 Nginx 是一款高性能的 web 服务器、反向代理服务器以及电子邮件(IMAP/POP3/SMTP)代理服务器,由俄罗斯开发者伊戈尔塞索耶夫(Igor Sysoev)编写,并在2004年10月4日发布了首个公开版本0.1.0。Nginx…

简单了解JVM

一.JVM简介 jvm及Java virtual machineJava虚拟机,它是一个虚构出来的计算机,一种规范。其实抛开这么专业的句子不说,就知道 JVM 其实就类似于一台小电脑运行在 windows 或者 linux 这些操作系统环境下即可。它直接和操作系统进行交互&#…

【VS2019】x64 Native Tools Command Prompt for Vs 2019使用conda命令进入环境

【VS2019】x64 Native Tools Command Prompt for Vs 2019使用conda命令进入环境 安装完VS2019后,打开终端x64 Native Tools Command Prompt for Vs 2019,直接运行conda会出现‘conda’ 不是内部或外部命令,也不是可运行的程序 原因分析:这是因为没有设置anaconda的环境变…

SpringBoot学习笔记四

SpringBoot学习笔记四-监听机制 1. SpringBoot监听器1.1 无需配置1.1.1 CommandLineRunner使用1.1.2 ApplicationRunner的使用1.1.3 CommandLineRunner与ApplicationRunner的区别 1.2 需要创建META-INF文件,并在其中创建spring.factories,配置相关的信息…

apline安装redisjson

安装前的说明 由于redis现在下载redisjson很繁琐,还可能需要科学上网,只能自己编译了 系统是apline, 为什么是这个系统?原因是docker安装redis是用了这个系统 下载地址,按照实际情况选择,如果不行就老老实实自己编译吧…

【漏洞复现】用友畅捷通CRM get_usedspace存在SQL注入漏洞

0x01 阅读须知 “如棠安全的技术文章仅供参考,此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等(包括但不限于)进行检测或维护参考,未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供…

2024年最佳网页设计师AI工具

人工智能(AI)正在改变设计师相当快速的工作方式,为更智能地工作提供新的效率。 人工智能不再只是一个流行词;它改变了游戏规则。但人工智能能为网页设计师做什么呢?新网页设计师AI工具工具可以为从内容创建到图像细化…

Thingsboard PE智慧运维仪表板实例(一)【智慧排口截污实例】

1、仪表板总览 以该实际落地项目为案例,跟着我一起搭建智慧运维大屏!社区版和专业版都通用。本文是致力于快速搭建,所以不会详细去讲Thingsboard的知识点,只讲如何配置和使用部件。 搭建仪表板的整体效果如下: 点击左侧设备列表可以查看设备详细页面: 2、设备 我的设备都…

2024年第十七届 认证杯 网络挑战赛 (C题)| 云中的海盐 | 辐射传输方程 Stefan-Boltzmann分析 |数学建模完整代码+建模过程全解全析

当大家面临着复杂的数学建模问题时,你是否曾经感到茫然无措?作为2022年美国大学生数学建模比赛的O奖得主,我为大家提供了一套优秀的解题思路,让你轻松应对各种难题。 让我们来看看认证杯 网络挑战赛 (C题)&#xff01…

P1090 [NOIP2004 提高组] 合并果子

原题链接:[NOIP2004 提高组] 合并果子 / [USACO06NOV] Fence Repair G - 洛谷 目录 1. 题目描述 2. 思路分析 3. 代码实现 1. 题目描述 2. 思路分析 优先队列。 当堆数大于1时,每次将最小的两个(最小堆的堆顶)取出&#xff…

2017NOIP普及组真题 4. 跳房子

线上OJ: 一本通:http://ybt.ssoier.cn:8088/problem_show.php?pid1417\ 核心思想 首先、本题中提到 “ 至少 要花多少金币改造机器人,能获得 至少 k分 ”。看到这样的话语,基本可以考虑要使用 二分答案。 那么,本题中…

2024.4.11

1.思维导图 2.指针形式验证大小端存储 #include<myhead.h>int main(int argc, const char *argv[]) {int num 0x12345678;char* ptr (char *)&num;if(*ptr 0x12){printf("big endian\n");}else if(*ptr 0x78){printf("little endian\n");}r…

Struts2的入门:新建项目——》导入jar包——》jsp,action,struts.xml,web.xml——》在项目运行

文章目录 配置环境tomcat 新建项目导入jar包新建jsp界面新建action类新建struts.xml,用来配置action文件配置Struts2的核心过滤器&#xff1a;web.xml 启动测试给一个返回界面在struts.xml中配置以实现页面的跳转&#xff1a;result再写个success.jsp最后在项目运行 配置环境 …

C++ //练习 11.22 给定一个map<string, vector<int>>,对此容器的插入一个元素的insert版本,写出其参数类型和返回类型。

C Primer&#xff08;第5版&#xff09; 练习 11.22 练习 11.22 给定一个map<string, vector<int>>&#xff0c;对此容器的插入一个元素的insert版本&#xff0c;写出其参数类型和返回类型。 环境&#xff1a;Linux Ubuntu&#xff08;云服务器&#xff09; 工具…

Python 全栈体系【四阶】(二十七)

第五章 深度学习 三、OpenCV 5. 图像梯度处理 5.1 模糊处理 # 图像模糊处理示例 import cv2 import numpy as np## 中值滤波 im cv2.imread("../data/lena.jpg", 0) cv2.imshow("orig", im)# 调用medianBlur中值模糊 # 第二个参数为滤波模板的尺寸大小…

探索基于WebRTC的有感录屏技术开发流程

title: 探索基于WebRTC的有感录屏技术开发流程 date: 2024/4/7 18:21:56 updated: 2024/4/7 18:21:56 tags: WebRTC录屏技术屏幕捕获有感录屏MediaStream实时传输音频录制 第一章&#xff1a;技术原理 WebRTC&#xff08;Web Real-Time Communication&#xff09;是一种开放源…

vue源码解析——v-if和v-for哪个优先级高,如何避免两者同时使用

首先&#xff0c;官方不推荐v-if和v-for在同一个元素上使用。其次&#xff0c;如果两者同时使用&#xff0c;v-if和v-for的优先级怎么确定&#xff1f;在vue2和vue3中这两者的优先级顺序不一样。vue2是v-for优先&#xff0c;条件不存在时也会渲染多个注释节点。在vue3中进行了改…

互联网大厂ssp面经(操作系统:part1)

1. 什么是进程和线程&#xff1f;它们之间有什么区别&#xff1f; a. 进程是操作系统中运行的一个程序实例。它拥有独立的地址空间和资源&#xff0c;可以独立执行。 b. 线程是进程内的一个执行单元&#xff0c;一个进程可以包含多个线程。 c. 线程共享进程的资源&#xff0c;…

HarmonyOS开发实例:【数字管家app】

一&#xff0e;概述 本应用是基于RK3399开发板&#xff0c;使用OpenHarmony3.1-Release开发的应用。通过OpenHarmony的分布式技术&#xff0c;使多人能够一起画画。 1.应用运行效果图&#xff1a; 2.分布式画板使用示意图 如上图所示&#xff0c;用户1、用户2在各自本地端进行…