Flink-DataWorks第六部分:数据运维(第62天)

系列文章目录

  1. 运维中心
    4.1 功能概述
    4.2 操作流程
    4.2.1 操作流程概览
    4.2.2 步骤一:查看周期任务配置
    4.2.3 步骤二:测试周期任务
    4.2.4 步骤三:周期任务补历史数据
    4.2.5 步骤四:查看周期实例
    4.2.6 步骤五:查看执行结果
    4.2.7 步骤六:创建自定义监控规则

文章目录

  • 系列文章目录
  • 前言
  • 4. 运维中心
    • 4.1 功能概述
    • 4.2 操作流程
      • 4.2.1 操作流程概览
      • 4.2.2 步骤一:查看周期任务配置
      • 4.2.3 步骤二:测试周期任务
      • 4.2.4 步骤三:周期任务补历史数据
      • 4.2.5 步骤四:查看周期实例
      • 4.2.6 步骤五:查看执行结果
      • 4.2.7 步骤六:创建自定义监控规则


前言

本文主要详解了DataWorks的数据运维,
后续章节:flink业务开发

4. 运维中心

4.1 功能概述

运维中心包括运维大屏、实时任务运维、周期任务运维、手动任务运维、智能监控、智能诊断、资源运维和引擎运维功能模块,为用户提供任务操作与状态、引擎、资源等多方位的运维能力。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.2 操作流程

登录DataWorks控制台,单击左侧导航栏的数据建模与开发 > 运维中心,在下拉框中选择对应工作空间后单击进入运维中心。或者直接点击上方的运维中心进入。
在这里插入图片描述

4.2.1 操作流程概览

操作流程可以分为两个阶段:
阶段一:测试验证调度任务
步骤一:查看周期任务配置
为避免周期任务调度不符合预期,建议在任务发布后先检查周期任务配置的调度参数、调度资源组等是否正确。若不符合预期,请修改相应配置并重新发布。
步骤二:测试周期任务
通过冒烟测试功能验证周期任务在生产环境执行是否正确。若执行出错,请根据报错及时处理,保障任务可正常运行。
步骤三:周期任务补历史数据
通过补数据功能可重新计算历史时间段内的数据。
步骤四:查看周期实例
周期任务发布成功后会根据调度周期生成周期实例,如果在DataStudio中配置的实例生成方式为T+1次日生成,则任务将在第二天开始调度;如果配置为发布后即时生成,则任务当天便会调度。用户可查看调度实例的生成及运行情况,判断任务的周期调度是否正常。
步骤五:查看执行结果
节点执行测试或补数据操作后,用户可查看数据的写入情况。
阶段二:监控周期调度任务
步骤六:创建自定义监控规则
用户可根据业务需求,为周期调度任务配置智能监控规则,监控任务的调度运行状况,保障该任务后续可以正常调度。
步骤七:创建资源组自动运维规则
通过自定义独享资源组的监控规则,对独享资源组的使用率及资源组上等待的实例数设置监控报警,并进行相关运维操作。

4.2.2 步骤一:查看周期任务配置

为避免周期任务调度不符合预期,建议在任务发布后先查看该任务的配置(例如,任务的调度参数、节点依赖关系等)是否正确。

(1)进入运维中心。
(2)查找目标节点。
a.在左侧导航栏单击周期任务运维 > 周期任务。
b.在周期任务页面搜索目标节点。
(3)查看节点详情。
a.单击目标节点,进入节点DAG图。
b.单击展开详情,查看节点的详细信息。
本文示例在周期任务列表中,查找已发布的result_table节点,查看其调度参数、调度资源组配置是否正确。
在这里插入图片描述

另外,周期任务中还可以对任务进行其他管理。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.2.3 步骤二:测试周期任务

通过对周期任务执行冒烟测试,验证该任务在生产环境的调度运行是否符合预期。该操作将真实执行代码逻辑。
注意:如果在数据开发环节进行了冒烟测试,这里可以跳过。
(1)进入冒烟测试
可以通过以下两种方式进入冒烟测试
 方式一:在周期任务列表,单击目标任务操作列的测试。

 方式二:在目标任务的DAG图,右键单击该任务,选择测试。
在这里插入图片描述

(2)配置任务测试运行的业务日期及运行时间,单击确定。
任务测试运行时会生成测试实例,用户可进入周期任务运维 > 测试实例页面查看实例的运行详情,判断其运行状况。
本文示例测试result_table节点的运行是否成功。
在这里插入图片描述

测试结果:
在这里插入图片描述

4.2.4 步骤三:周期任务补历史数据

周期任务开发完成并提交发布后,会按照调度配置定时运行。如果希望重新计算历史时间段内的数据,则可通过补数据功能实现。
(1)进入补数据。可通过如下两种方式进入补数据页面。
 方式一:在周期任务列表,单击目标任务操作列的补数据。
 方式二:在目标任务的DAG图,右键单击该任务,选择补数据。
(2)选择补数据模式。
可根据需求选择如下补数据模式:
在这里插入图片描述
在这里插入图片描述

(3)配置补数据参数。
根据业务需求配置补数据的业务日期、待补数据的节点等。
本文示例使用当前节点模式,对result_table节点补业务日期20231108~20231109时间段的数据。配置步骤参考下图。
在这里插入图片描述
在这里插入图片描述

点击确定后,可以在补数据实例中看到补数据实例。
在这里插入图片描述

4.2.5 步骤四:查看周期实例

周期任务发布成功后会根据调度周期生成周期实例,如果在DataStudio中配置的实例生成方式为T+1次日生成,则任务将在第二天开始调度;如果配置为发布后即时生成,则任务当天便会调度。用户可查看生成的周期实例,判断任务的调度运行是否正常。
(1)进入周期实例。
在运维中心左侧导航栏,单击周期任务运维 > 周期实例。
(2)查看周期实例。
根据周期任务的调度配置,查看该任务是否调度生成相应周期实例并运行正常。

若实例为未运行状态,建议进行如下处理:
找到未运行的节点,然后右键展开父节点,然后选择层数(可以选择最多的层数)。此时可以看到上游所有依赖的节点,看一下具体哪一个报错了或者没有运行导致该节点没有运行。
在这里插入图片描述

4.2.6 步骤五:查看执行结果

周期任务进行测试或补数据后,除了在临时查询中使用sql查询数据外,还可以进入数据地图查看。在数据地图查询目标表,通过查看表详情确认数据写入是否正确。
进入数据地图,搜索result_table,然后点击表进去
在这里插入图片描述

即可以看表的元数据信息,以及进行数据预览

在这里插入图片描述

注意:
(1)RAM用户默认无MaxCompute引擎中生产表的查询权限。用户可进入数据地图,在表的详情页申请该表权限。详情请参见申请表权限。
(2)在使用临时查询时,默认是开发环境的表,如果需要查询生产环境的表需要加上项目名。

set odps.sql.allow.fullscan=true;select * from dwhmcx.result_table;

在这里插入图片描述

4.2.7 步骤六:创建自定义监控规则

节点测试验证无误后,可为节点自定义监控规则,监控节点运行状态。当节点运行出错时DataWorks会根据配置发送相应报警,以便用户及时发现并处理异常,保障节点日后可正常调度。
(1)在左侧导航栏单击智能监控 > 规则管理。
(2)新建自定义规则。
 单击新建自定义规则。
 配置规则信息。
可根据业务需求,自定义所需规则。

在配置规则时,可以为单个任务节点配置,也可以为基线或工作空间或业务流程或资源组配置,配置详情请参见规则管理。
通常用的有基线管理和工作空间和业务流程,在这里,以工作空间为例进行学习。
 规则名称设置为工作空间监控
 对象类型设置为工作空间
 规则对象选择dwhmcx,并添加
 触发条件也有多种选择,这里选择出错
在这里插入图片描述

 报警方式选择短信
 接收人勾选任务责任人以及相关开发人员
 配置完成后点击确认

在这里插入图片描述

常见问题:

https://help.aliyun.com/zh/dataworks/support/faq-9/?spm=a2c4g.11186623.0.0.40f627f7ms4p5i

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/396785.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

knn图像分类

K近邻算法(K-NN),即给定一个已训练的数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,则判定该输入实例同属此类。 1. OpenCV K近邻模块的使用 接下来通过一个例子&…

掌握 Nuxt 3 的页面元数据:使用 definePageMeta 进行自定义配置

title: 掌握 Nuxt 3 的页面元数据:使用 definePageMeta 进行自定义配置 date: 2024/8/11 updated: 2024/8/11 author: cmdragon excerpt: 摘要:本文详细介绍Nuxt 3框架中definePageMeta的使用方法,包括如何为页面组件定义元数据&#xff0…

集合的框架(之一)

集合的含义: 集合是一个可变的容器,可以随时向集合中添加元素,也可以随时从集合中删除元素。另外,集合还提供了若干个用来操作集合中数据的方法。集合里的数据,我们称之为元素(elements);集合只能用来存储…

2025年美国数学竞赛AMC8暑期备考:吃透625道真题和知识点(持续)

距离接下来最近的2025年AMC8美国数学竞赛还有几个月的时间,实践证明,做真题,吃透真题和背后的知识点是备考AMC8有效的方法之一。 通过做真题,可以帮助孩子找到真实竞赛的感觉,而且更加贴近比赛的内容,可以…

1915_开源C语言实现的通用队列

经常在工作中遇到一些队列处理的场景,以前要么是借用FreeRTOS这样的系统中的相关功能,要么是通过数组做一个简单的队列模型。但是,这两种方案都具有一定的局限性能,前者要求的FreeRTOS不见得相应的软件中有,而后者只能…

超好玩的肉鸽游戏:《暴君的游戏》手机单机游戏分享

《暴君的游戏》(Despots Game)是一款结合了自走棋和roguelike元素的像素策略冒险游戏。游戏以其独特的战斗系统和丰富的职业选择,为玩家提供了深度的策略体验和探索乐趣。 游戏特色包括: 角色职业多样性:玩家可以招募…

使用历史版本比对法排查C++程序中的内存泄漏问题

目录 1、问题描述 2、使用Process Explorer实时查看程序的虚拟内存占用 2.1、对于内存泄漏问题,需要查看程序占用的虚拟内存 2.2、Windows任务管理器中看不到程序进程占用的虚拟内存,使用Process Explorer工具可以看到 2.3、通过Process Explorer工具看到每次泄漏的内存…

大数据-75 Kafka 高级特性 稳定性-一致性保证 LogAndOffset(LEO) HightWatermark(HW) 水位/水印

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…

LVS实战项目

LVS简介 LVS:Linux Virtual Server,负载调度器,内核集成,章文嵩,阿里的四层SLB(Server LoadBalance)是基于LVSkeepalived实现。 LVS集群的类型 lvs-nat : 修改请求报文的目标IP, 多目标 IP 的 DNAT lvs-dr &#xff…

本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——6Resnet实现黑线识别

本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——6Resnet实现黑线识别 ​ 比赛还有重要部分就是黑线的识别,这块地平线社区的帖子很多 ​ 在本次我就使用了社区吴超大佬写出的文章,当然我们的步骤有所不同,也是比较省…

黄牛杀手 抢票脚本 V3.0

黄牛杀手 抢票脚本 V3.0 介绍 现在黄牛太tm多了,根本抢不到票 为了解决这个问题,开发了这个脚本,支持大麦网,淘票票、缤玩岛等多个平台 依赖 selenium (4.10.0以下版本) pip install selenium 现在黄牛太tm多了,根…

2.类和对象(上)

1. 类的定义 1.1 类定义格式 • class为定义类的关键字,Stack为类的名字,{ }中为类的主体,注意类定义结束时后面分号不能省略。类体中内容称为类的成员:类中的变量称为类的属性或成员变量; (类和结构体非常像&#…

LVS原理——详细介绍

目录 lvs简介 LVS作用 LVS 的优势与不足 LVS概念与相关术语 LVS的3种工作模式 LVS调度算法 LVS-dr模式 LVS-tun模式 ipvsadm工具使用 lvs简介 LVS 是Linux Virtual Server的简称,也就是 Linux 虚拟服务器,是一个极好的负载均衡解决方案,它将一个…

计数排序,桶排序,基数排序

计数排序: 找出数据中的最大值和最小值,并创建哈希表,把 数据-最小值 作为数组的下标访问哈希表并标记数量,标记完后,遍历哈希表,当表中的值大于0,把 **下标最小值 (下标元素-最小值)**还原数据…

LLVM 寄存器分配

概述 基本寄存器分配器是四种寄存器分配器中最简单的寄存器分配pass实现(<llvm_root/livm/lib/CodeGen/RegAllocBasic.cpp>) 但麻雀虽小&#xff0c;五脏俱全&#xff0c;基本寄存器分配器中实现了根据溢出权重确实虚拟寄存器优先级、按优先级分配物理寄存器&#xff0…

韦东山瑞士军刀项目自学之UART

放自己一星期假回家&#xff0c;回来继续准备秋招。 本章记录关于UART协议的相关知识笔记。平时主要还是基于HAL库开发&#xff0c;但笔记里也讲了韦老师介绍的如何控制寄存器来设置UART的参数。 以及一些UART防止采集的抖动设置的一些策略与波特率与比特率的区别等。

文件共享服务NFS(服务名nfs,端口tcp/2049)

目录 前言 配置文件 工作原理 NFS服务器的配置 查看服务器是否安装 查看服务器状态 开启服务 编写配置文件 客户端挂载 前言 NFS&#xff08;Network File System&#xff09;是一种分布式文件系统协议&#xff0c;它允许网络中的不同计算机共享文件和目录&#xff0…

使用tailwindcss轻松实现移动端rem适配

本示例节选自小卷全栈开发实战系列的《Vue3实战》。演示如何用tailwindcss所支持的rem体系轻松实现一个仿b站移动端头部导航栏rem适配。 友情声明 学习分享不易&#xff0c;如果小伙伴觉得有帮助&#xff0c;点赞支持下。满30赞&#xff0c;将随文附赠录屏讲解&#xff0c;感谢…

树莓派4/5:运行Yolov5n模型(文末附镜像文件)

〇、前言 因国内网络问题&#xff0c;可直接烧录文末镜像文件&#xff0c;或者按照本教程进行手动操作。 一、实验目的 在树莓派4B运行Yolov5n模型。 二、实验条件 1、Windows 11计算机&#xff1a;安装了Mobaxterm 2、树莓派4B&#xff1a;64Bit Lite OS&#xff0c;安装了…

案例:Nginx + Tomcat集群(负载均衡 动静分离)

目录 案例 案例环境 案例步骤 部署Tomcat服务器 部署Nginx服务器 实现负载均衡和读写分离 日志控制 案例 案例环境 操作系统 IP 地址 角色 CentOS 192.168.10.101 Nginx服务器&#xff08;调度器&#xff09; CentOS 192.168.10.102 Tomcat服务器① CentOS 1…