DataWorks (数据工厂)介绍

介绍

DataWorks 是阿里云推出的一体化大数据开发与治理平台,曾用名"数据工厂""大数据开发套件"

最新版本是3.0 

它是一套基于MaxCompute(原ODPS)的DW(数据仓库)解决方案,它集成了阿里多年的DW实施经验,提供数据集成、数据开发、数据治理、数据分享功能,并为代码开发、调试、发布、运维、监控和管理提供了一个高效、安全的离线数据开发环境。

DataWorks支持多种计算和存储引擎服务,包括离线计算MaxCompute、开源大数据引擎E-MapReduce、实时计算(基于Flink)、机器学习PAI、图计算服务Graph Compute和交互式分析服务等,并且支持用户自定义接入计算和存储服务。

应用场景

构建数据仓库

功能

数据集成: 拥有ETL功能, 是更稳定高效更弹性收缩的平台

数据集成

多数据源快速上云

基本上市面上的都支持, 包括但不限于MySQL、MaxCompute、Hologres、OSS、Kafka等几十种数据源,各数据源支持的同步方案及读写插件不同。此外,DataWorks支持的数据源类型还包括关系型数据库、非结构化存储、大数据存储、消息队列等,通过定义来源与去向数据源,并使用数据集成提供的数据抽取插件(Reader)、数据写入插件(Writer),实现任意结构化、半结构化数据源之间的数据传输

多种配置方式

向导方式;脚本方式

多种同步方式

全量, 增量, 批量上传,多任务频发等等

任意数据源、任意网络环境数据抽取

数据开发

多引擎工作流混编

可以把多个处理程序上的引擎串起来, 形成一个跨引擎的长流程

SQL智能编辑器

智能地提示语法错误, 动态搜索查找字段, 补齐,排版等

科学规范的项目模式

生产开发分离的模式

业务流程与解决方案

可以从业务角度创建业务流程, 可以把多个业务流程组合成解决方案

任务运维

主要是离线任务的运维管理, 

运维大屏

以可视化图表,报表的形式, 来展示任务的整体运行情况, 

周期,手动任务运维

开发的数据处理任务, 经过调度系统运行以后,会产生示例----周期的示例,手动的示例,

任务运维是对任务实例的操作,处理

智能监控

对任务的运行情况进行监控: 通过设置监控规则,根据任务运行情况决定是否报警, 给谁报警等

及时报警减少事故发生风险

任务发布

实现代码从开发环境到生产环境的部署, 管理

项目克隆

数据治理

数据质量

通过设定核查规则, 在一张数据表的数据产生之后, 用校验规则去校验数据, 如果不符合规则,就属于数据故障,不满足质量要求,发生报警

可以设定橙色报警和红色报警

橙色报警: 只发报警, 任务不停;

红色报警: 任务会停止, 可以避免数据质量问题的扩散

数据地图

编排数据目录, 数据探查, 数据血缘分析, 数据溯源等, 可以方便数据表的组织管理, 数据表的查找, 以及数据表之间的来源与去向, 

安全中心

数据权限管理:  提供数据权限的申请和审批的功能, 提高数据的安全性

数据保护伞

数据安全与管理的一个产品名称, 对敏感数据,比如手机号,身份证号进行智能的识别,敏感等级分级,对敏感数据进行脱敏, 对敏感数据的访问情况进行详细记录, 统计访问情况.

设置审计规则: 比如某个用户对敏感数据的访问触犯了审计规则, 会被记录为风险操作, 发出报警>>可以及时发现用户对敏感数据的不合规操作, 帮助安全管理人员对数据进行安全管理,防止敏感数据泄漏的风险

数据服务

把数据平台分析出的结果,报表封装成服务的API, 进行数据分享,数据变现,

还可以为企业搭建统一的数据服务总线, 实现对内对外的统一管理, 

Serverless构建方式

即无服务器架构, 好处: 只需要关注API本身的查询逻辑, 不用关心运行环境,基础设施

可以实现弹性扩展,降低运维成本

过滤器与函数

附加功能: 可以对查询结果进行二次的加工过滤, 

支持编写函数,并将函数关联至API,使函数可以作为API的过滤器使用,对API的请求参数或返回结果进行加工处理。数据服务支持的函数类型包括Aviator函数、Python函数,用户可以在数据服务中创建函数、测试函数、发布函数,发布后的函数可被进一步关联至API,作为API的过滤器。如果将函数设置为API的前置过滤器,当API被调用时,函数可以对API的请求参数进行预先处理;如果将函数设置为API的后置过滤器,当API被调用时,函数可以对API的返回结果进行二次加工和改造。

服务编排

允许用户按照业务逻辑以串行、并行和分支等结构编排多个API及函数服务为工作流。这种服务编排为用户提供了拖拽式、可视化的工作流编排能力,从而可以轻松管理复杂的任务工程。此外,数据服务基于业务流程实现以业务为单元的API开发,并基于业务流程对API、函数和服务编排进行组织管理

简单管理API生命周期

支持一键发布API至API网关,从而实现对API设计、开发、测试、发布、运维监测、安全管控以及下线等全生命周期管理。API网关提供API托管服务,涵盖API发布、管理、运维、售卖的全生命周期管理,并围绕API提供了权限管理、流量控制、访问控制等服务,帮助您简单、快速、低成本、低风险地实现微服务聚合、前后端分离、系统集成,向合作伙伴、开发者开放功能和数据

一键打通商业模式

支持一键发布API至API网关,实现对API设计、开发、测试、发布、运维监测、安全管控以及下线等全生命周期管理。同时,您也可以将API上架至阿里云API市场,快速实现数据价值的变现,最终形成商业闭环。通过这种方式,DataWorks的数据服务帮助企业快速实现数据价值变现,最终形成商业闭环,从而一键打通商业模式

数据应用

数据分析

可以流畅地进行数据处理、分析、加工及可视化操作。在数据分析板块中,您不仅可以在线洞察数据,还可以编辑和共享数据。DataWorks的数据分析功能为企业提供了全面的数据分析和服务共享能力,可便捷地连接多种数据源、支持SQL查询,并提供电子表格等多样化的数据分析工具,以满足企业日常的数据提取和分析需求 

应用开发 App Studio   

App Studio是一款数据开发工具,用户无需下载、安装本地IDE和配置环境变量,只需一个浏览器即可编写、运行和调试应用程序,体验和本地IDE一样的编程效果,在线发布应用。App Studio提供了丰富的前端组件,通过自由拖拽,即可简单快速搭建前端应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27455.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

信息技术知识赛系统设计与实现(代码+数据库+LW)

摘 要 传统办法管理信息首先需要花费的时间比较多,其次数据出错率比较高,而且对错误的数据进行更改也比较困难,最后,检索数据费事费力。因此,在计算机上安装信息技术知识赛系统软件来发挥其高效地信息处理的作用&…

VirtualBox虚拟机转VM虚拟机

前言:部分靶机只适用于VirtualBox,VM打不开VirtualBox的文件,所以需要进行转换 前置条件:本机已经下载VM和VirtualBox 第一步:文件转换 找到VirtualBox.exe所在位置,启动cmd窗口 文件转换的命令&#xf…

ArcGIS操作:11 计算shp矢量面的质心坐标

1、打开属性表 2、添加字段 3、设置字段名称、类型 4、选择创建的字段,计算几何 5、选择属性质心的x坐标、坐标系(y坐标同理) 注意:计算坐标一般使用的是地理坐标系(投影坐标系转地理坐标系教程:ArcGIS操作…

使用 DeepSeek 生成流程图、甘特图与思维导图:结合 Typora 和 XMind 的高效工作流

在现代工作与学习中,可视化工具如流程图、甘特图和思维导图能够极大地提升信息整理与表达的效率。本文将详细介绍如何使用 DeepSeek 生成 Mermaid 文本,结合 Typora 快速生成流程图和甘特图,并通过 Markdown 格式生成思维导图,最终…

【Cadence仿真学习笔记】ADS Dynamic Link报错model is reserved的解决办法

首先创建好原理图 创建symbol 在library manager下就会出现symbol了 在Cadence的CIW窗口中运行ADS dynamic link 打开ADS后,创建对应的cellview 加入控件OPTIONS 加入网表netlist 这个时候的Netlist没有路径 点击加载symbol 把原来的netlist include删掉…

【二.提示词工程与实战应用篇】【1.提示词工程入门:AI对话的艺术】

大家好,今天咱们来聊聊一个特别有意思的话题——提示词工程。你可能已经听说过这个词,或者在使用AI工具时不经意间接触过它。但提示词工程到底是什么?它为什么这么重要?咱们今天就来深入探讨一下,看看它是如何影响我们与AI的对话,以及如何在实际应用中发挥作用的。 什么…

[密码学实战]Java实现国密(SM2)密钥协商详解:原理、代码与实践

一、代码运行结果 二、国密算法与密钥协商背景 2.1 什么是国密算法? 国密算法是由中国国家密码管理局制定的商用密码标准,包括: SM2:椭圆曲线公钥密码算法(非对称加密/签名/密钥协商)SM3:密码…

unity lua属性绑定刷新

我们现在有一个 角色属性类叫heroModel,内容如下,当heroModel中的等级发生变化的时候,我们需要刷新界面显示等级信息,通常我们是在收到等级升级成功的协议的时候,发送一个事件,UI界面接受到这个事件的时候,刷新一下等级…

制服小程序的“滑手”:禁用页面左右滑动全攻略

哈哈,看来你已经很聪明地发现了小程序中左右滑动的“顽皮”行为!😄 没错,我们可以通过设置 disableScroll 属性来“管教”它,同时结合 CSS 样式让页面既禁得住横向“乱跑”,又能顺畅地上下滚动。你的方案已…

蓝桥备赛(六)- C/C++输入输出

一、OJ题目输入情况汇总 OJ(online judge) 接下来会有例题 , 根据一下题目 , 对这些情况进行分析 1.1 单组测试用例 单在 --> 程序运行一次 , 就处理一组 练习一:计算 (ab)/c 的值 B2009 计算 (ab)/c …

Golang的性能分析指标解读

Golang的性能分析指标解读 一、概述 语言)是一种由Google开发的开源编程语言,以其并发性能和高效的编译速度而闻名。对于程序员来说,了解如何对Golang应用程序进行性能分析是非常重要的,因为这能帮助他们发现潜在的性能瓶颈并对其…

【前端基础】Day 8 H5C3提高

目录 1. HTML5新特性 1.1 新增语义化标签 1.2 新增多媒体标签 1.3 新增input类型 1.4 新增表单属性 2. CSS3的新特性 2.1 新增选择器 2.1.1 属性选择器 2.1.2 结构伪类选择器 2.1.3 伪元素选择器(重点) 2.2 CSS3盒子模型 2.3 CSS3其他特性&a…

Android系统_Surface绘制流程

目录 一,框架图 二,核心代码 一,框架图 对上面这张图的总结 二,核心代码 /Volumes/aosp/android-8.1.0_r52/frameworks/native/services/surfaceflinger/SurfaceFlinger.cpp void SurfaceFlinger::onMessageReceived(int32_t what) {ATRACE_CALL();switch (what) {case Mes…

CDefView::_OnFSNotify函数分析

进入CDefView::_OnFSNotify函数时状态栏 _UpdateStatusBar函数之后增加一个对象,变成7个对象。 LRESULT CDefView::_OnFSNotify(LONG lNotification, LPCITEMIDLIST* ppidl) { LPITEMIDLIST pidl; LPCITEMIDLIST pidlItem; // we may be registered for no…

KVMOVS组网配置案例-4

0.配置要求 1.使用ovs创建一个网桥,网桥上添加宿主机eth0接口,接口为trunk,可转发所有vlan的数据2.使用KVM创建并图形安装两个linux虚拟机vm1,vm2。3.vm1关联ovs的vlan10接口,vm2关联ovs的vlan20接口。4.vm1获取vlan10的IP地址,v…

C#—Settings配置详解

C#—Settings配置详解 在C#项目中,全局配置通常指的是应用程序的设置(settings),这些设置可以跨多个类或组件使用,并且通常用于存储应用程序的配置信息,如数据库连接字符串、用户偏好设置等。 Settings配置…

Redis 哨兵模式

哨兵模式(Sentinel) 是 Redis 提供的一种高可用性(High Availability, HA)解决方案,用于监控和管理 Redis 主从架构中的主节点(Master)和从节点(Slave)。当主节点出现故障…

【大厂AI实践】美团:美团智能客服核心技术与实践

【大厂AI实践】美团:美团智能客服核心技术与实践 🌟 嗨,你好,我是 青松 ! 🌈 自小刺头深草里,而今渐觉出蓬蒿。 NLP Github 项目推荐: 【AI 藏经阁】:https://gitee.com…

linux离线安装miniconda环境

1 下载安装包 可以在官网下载最新版 https://www.anaconda.com/download/success#miniconda 或者在软件目录选择合适的版本 https://repo.anaconda.com/miniconda/ 安装包传入离线服务器 ./Miniconda3-py311_24.9.2-0-Linux-x86_64.sh2 运行安装包 ./Miniconda3-py311_24…

线程相关八股

1. 线程和进程的区别? 进程:进程可以简单理解为进行一个程序,比如说我们打开一个浏览器,打开一个文本,这就是开启了一个进程,一个进程想要在计算机中运行,需要将程序交给CPU,将数据…