数据资产与自助BI的一体化实践

01
数据资产中的数据治理

随着数据资源被提高到数据资产的高度,数据治理成为确保有效管理和利用数据资产的一组流程和技术,而数据资产目录是包含企业数据资产的全息描述信息的存储库,并充当有效管理数据资产的(逻辑上的)单一事实来源。组织中的分析师和数据科学家有效地使用数据资产目录来回答业务问题,数据治理专员通过数据资产目录实施数据治理策略,并促进数据的正确使用。
通过资产目录发布的数据资产,通过以下数据治理能力达成资产认证:

  • 数据质量保障 :数据资产是在有效数据质量监控下的有效数据,通过业务规则承袭,业务用数需求等建设数据治理度量规则,确保用户在使用数据时,或者数据管道搬运数据时,系统把数据质量问题及时提醒数据分析师,以便评估数据质量对数据分析的可用性。
  • 权威源头认证:数据资产目录帮助我们识别哪些数据集是数据的权威源头,并通过认证的方式发布资产,并跟踪数据所有权和认证随时间的变化。
  • 数据分类分级:数据安全治理要求根据数据敏感度、PII 以及其他关键元数据对数据进行数据安全的分类分级。数据安全等级是数据资产如何共享和流通的依据,是数据资产必备的属性。
  • 数据血脉关系:在使用数据集之前,分析师必须首先了解基础数据的来源。数据血缘关系图是对数据来源的可视化展示,为数据集成建立了完整的数据加工流向说明,可以帮助用户确定数据是否具有正确信息,以帮助回答特定业务问题。
  • 指标与标准:如果一个组织对关键企业指标和业务属性没有一套一致的定义,那么随着时间的推移,不同的分析师总是会使用一组不同的规则来衡量同一个指标。这种不一致给企业带来了一组相互矛盾的分析结果,并导致对数据缺乏信任。
  • 其它重要信息:使用情况统计信息是从基础 BI 工具中收集的,并在数据治理工具中呈现给用户。这些统计信息标识了业务用户对每个数据集的使用程度,并由业务用户来确定哪些数据集在用户群中获得了使用,哪些数据集则尚未发掘业务应用。

02
数据资产与企业级BI

数据资产目录提供的丰富业务元数据,对于数据分析师和数据科学家来说是非常宝贵的,因为他们可以了解更多的数据上下文信息,并决定在分析中使用哪些现有资产。不过,只靠这个工具还不能完全满足组织的完整治理需求,因为它们无法支持企业中所有数据使用者的需求。典型的业务用户不会将数据目录工具用作其日常工作的一部分,市场上的BI和分析工具通常没有与数据资产进行有效集成,用户不会从其中包含的大量信息中受益。因此,许多组织都难以从维护这些工具中的治理数据所需的大量持续投资中实现业务价值。

另一方面,随着数据管理的发展,企业级BI成为企业数据管理要求,越来越多的企业要求数据分析在数据安全可靠,可管可控的背景下开展:

  • 数据安全和合规性: 受管理的BI解决方案包括强大的数据安全措施,以确保敏感数据的保护。这有助于确保企业数据不会被未经授权的人访问。此外,它还有助于确保企业符合法规和合规性要求,如数据安全法,个保法等。
  • 数据整合和质量控制: 受管理的企业级BI解决方案通常包括数据整合和质量控制功能,以确保数据的一致性和准确性。这有助于减少数据错误和冗余,提高数据可信度。
  • 用户权限和访问控制: 受管理的企业级BI解决方案允许企业管理员配置用户权限和访问控制,以确保只有授权人员能够访问特定数据和报表。这有助于保护数据的安全性。
    综上所述,数据资产的治理和BI可视化分析是相辅相成的关系,将两者结合起来,可以让BI的自服务能力更强,惠及更多业务用户。同时也让数据治理有的放矢,数据资产落地可用,发挥数据治理的显性价值。

下面我分享一下Datablau的探索。

03
数据分析治理一体化方案

数据与分析(D&A)治理方案是一种组织内部的框架和策略,用于确保数据和分析活动在组织内部有效管理、保护和利用。一个健全的D&A治理方案有助于确保数据的质量、合规性、安全性和可用性,以支持决策制定和业务运营。
整个方案涉在产品和工具上,主要达到这几个点:

3.1 数据视图统一
数据资产的统一编目,可以按照业务的架构关系或者分析主题,将数据进行分类,非常便于用户找到有用的数据。BI工具中通常从数据库中采集到的元数据,是没有业务视角的技术元数据,业务用户需要在技术人员的帮助下,将数据进行分类并进行补全,这在一个企业级发生时,对企业整体分析造成很大的阻碍,不利于数据驱动的数据分析。
在我们的产品中,通过BI的接口,我们将元数据的业务语义等信息写入BI数据集中,并将数据目录和数据权限信息同步到用户视角之下,这对于最终用户是非常好的体验,也是数据治理组织应该赋能的方式。

在这里插入图片描述

                                                      (以FineBI为例)

3.2 数据权限统一
数据安全与合规是企业级数据管理的关键要求。在数据资产的定义中,完善了数据的所有者,技术管理者,参与者等干系人信息。同时也定义了数据的安全类别和等级。最后我们需要定义数据和组织间的数据访问策略和授权体系,这使得数据具备了标准化的流通和共享,同时在安全体系的审计和监控之下。
传统BI应用都采用了主题集市,这是一个分布式的以部门为单位的数据使用模式。这种模式之下,数据的授权和复制是很难追踪的。
现在企业的数据授权,大多是基于权限电子流的授权体系,这在数据比较少的情况下,还可以运转,但是一旦多到授权部门无法执行的地步,我们可能会被迫放松甚至放开数据权限的管理。这在过去很多企业都发生过。
根据这些痛点,Datablau发布了基于企业岗权体系统一数据访问的方案。

在这里插入图片描述

                                 (基于岗权体系的数据授权与访问)

在这个方案中,个人对数据的访问,完全由所在岗位决定。数据的权限粒度到行级和列级,按照对岗位的授权,进行RBAC粒度的权限绑定。最后数据的访问完全由数据网关进行控制。
这个方案的优点是管理简单,融入到岗位体系中。最终用户无感知,权限约束由数据网关完成。
在这里插入图片描述

                                                           (数据网关技术架构)

3.3 建立可用数据资产开发流程
数据资产的可用性(Availebility)是保持数据资产活力的重要指标。业界过去进行了大量的数据资产盘点的工作,对数据的业务实体进行了整合定义(参见华为L3-L4实体定义),这对于推动业务对数据的理解和管理,数据的业务化连接等方面起很大的作用。然而这对于本文的数据资产与企业BI的一体化运营,还是远远不够的。
此项工作的问题主要是盘点的数据资产是一个初级产品,距离可交付的数据产品,还需要大量的工作。
在我们的实践中,将数据资产的逻辑层盘点和数据交付进行了拉通,确保发布到BI的数据资产是可应用的数据,并对此进行的专项管理。
通过对数据资产的分类,我们将数据资产分为物理态,逻辑态,以及可交付。通过将数据资产和BI数据交付融入到一个体系中,更好的服务了用户。也是我们践行主动数据治理的理念,发挥数据治理的价值。

04
总结

BI工具是我们业务部门最重要的数据分析工具,通过这个集成方案,达到数据资产的赋能,更有利于提高业务部门数据分析能力。同时这也是数据治理非常好的机会,融治于用的主动治理方法,让数据治理价值显性化,提高了组织的业务可连接性。
Datablau的产品矩阵和解决方案,为以上方案提供支撑,经过数个案例验证,取得不错效果,希望对您有借鉴意义。
图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/182107.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode | 206. 反转链表

LeetCode | 206. 反转链表 OJ链接 这里有两个思路 我们先来看第一个思路: 创建一个新的链表,然后将原链表头插头插需要保存下一个的地址,再头插 代码如下: struct ListNode* reverseList(struct ListNode* head) {struct ListN…

Java自学第2课:Java语言基础知识要点

1 Java主类结构 任务:创建新项目名为item,包名为number,类名为first。 1.1 包声明 不指定包时,默认就是工程名,指定后,类文件可以分类了,是这意思吧。包就大概等于一个文件夹。而且在类文件中…

多人游戏小程序源码系统 带完整的搭建教程

现如今,人们对于娱乐和社交的需求也在不断提高。多人游戏作为一种能够满足人们社交需求的游戏类型,越来越受到用户的欢迎。同时,小程序作为一种轻量级的应用程序,在微信等平台上得到了广泛的应用和推广。因此,开发多人…

电商API接口文档|1688API接口的接入获取获得1688商品详情it按关键字搜索商品 按图搜索1688商品(拍立淘)

API接口文档 前面讲到的关于接口的请求方式、类型、原理、安全机制等,产品经理能够简单了解一些就可以满足日常工作中的需要。接口文档是产品经理日常工作中经常会使用到的,特别是做开放平台或B端的产品经理,需要经常的看和写接口文档。 那如…

【rust/esp32】初识slint ui框架并在st7789 lcd上显示

文章目录 说在前面关于slint关于no-std关于dma准备工作相关依赖代码结果参考 说在前面 esp32版本:s3运行环境:no-std开发环境:wsl2LCD模块:ST7789V2 240*280 LCDSlint版本:master分支github地址:这里 关于s…

计算机视觉基础——基于yolov5-face算法的车牌检测

文章目录 车牌检测算法检测实现1.环境布置2.数据处理2.1 CCPD数据集介绍2.1.1 ccpd2019及20202.1.2 文件名字解析 2.2数据集处理2.2.1 CCPD数据处理2.2.2 CRPD数据集处理 2.3 检测算法2.3.1 数据配置car_plate.yaml2.3.2 模型配置2.3.3 train.py2.3.4 训练结果 2.4 部署2.4.1 p…

【计算机组成与设计】Chisel取指和指令译码设计

本次试验分为三个部分: 目录 设计译码电路 设计寄存器文件 实现一个32个字的指令存储器 设计译码电路 输入位32bit的一个机器字,按照课本MIPS 指令格式,完成add、sub、lw、sw指令译码,其他指令一律译码成nop指令。输入信号名…

基于Matlab的yolo算法行人检测系统

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 # 基于Matlab编写的Yolo算法行人检测系统介绍 基于Matlab编写的Yolo算法行人检测系统是一种用于自动检测图像或视频…

了解web3,什么是web3

Web3是指下一代互联网,它基于区块链技术,将各种在线活动更加安全、透明和去中心化。Web3是一个广义的概念,它包括了很多方面,如数字货币、去中心化应用、智能合约等等。听不懂且大多数人听到这个东西,直觉感觉就像骗子…

HR如何应用人才测评系统来开展招聘?

企业招聘:名额少,应聘者多,这是必然现象!如果提高招聘效率,成为企业最为关心的问题。 问题可能有 1、简历多筛选难 每次收到一堆的简历,如何从中筛选出有效的人才,是一件头疼的事&#xff0c…

【Orangepi Zero2 全志H616】驱动舵机控制 / Linux定时器(signal、setitimer)

一、SG90舵机开发 舵机基本介绍 二、Linux定时器 signal 函数setitimer 函数原型signal、setitimer函数API调用 三、舵机 软件PWM实现 一、SG90舵机开发 舵机基本介绍 如下图所示,最便宜的舵机sg90,常用三根或者四根接线,黄色为PWM信号控…

requests库编写的爬虫程序没有那么难!

下文是用requests库编写的爬虫程序,用于爬取toutiao上的图片。程序使用了代理服务器,代理服务器的地址为duoip,端口号为8000。 import requests from bs4 import BeautifulSoup# 设置代理服务器 proxy_host duoip proxy_port 8000 proxy {…

modesim verilog仿真验证基本流程(新建工程方式)

文章目录 环境搭建一、在modelsim里创建一个新的工程二、新建verilog设计文件及仿真激励文件三、仿真结果本文演示如何使用modelsim新建工程进行功能仿真。 环境搭建 本文中采用的modelsim版本如下: modelsim altera 10.3d一、在modelsim里创建一个新的工程 打开modelsim软…

Python自定义函数练习(持续更新中~)

1.计算矩阵的面积和周长: class Rectangle:def __init__(self, width, height):self.width widthself.height heightdef area(self):return self.width * self.heightdef perimeter(self):return 2 * (self.width self.height)if __name__ "__main__"…

JAVA电商平台免费搭建 B2B2C商城系统 多用户商城系统 直播带货 新零售商城 o2o商城 电子商务 拼团商城 分销商城

1. 涉及平台 平台管理、商家端(PC端、手机端)、买家平台(H5/公众号、小程序、APP端(IOS/Android)、微服务平台(业务服务) 2. 核心架构 Spring Cloud、Spring Boot、Mybatis、Redis 3. 前端框架…

最速下降法

目录 前言 一、梯度下降相关数学概念 二、最速下降法实战 2.1、例图1 2.2、Matlab代码实现 2.3、例题2 三、小结 前言 最速下降法,在SLAM中,作为一种很重要求解位姿最优值的方法,缺点很明显:迭代次数太多&#xff0c…

YOLO v2(2016.12)

文章目录 AbstractIntroduction当前存在的困境基于此,我们给出了方法 BetterBatch NormalizationHigh Resolution ClassifierConvolutional With Anchor BoxesDimension ClustersDirect location predictionFine-Grained FeaturesMulti-Scale TrainingFurther Exper…

海洋专用cmocean颜色包_共22种--全平台可用

海洋专用cmocean颜色包_共22种–全平台可用 往期推荐: Python语言_matplotlib包_共80种–全平台可用 Python语言_single_color_共140种–全平台可用 R语言_RColorBrewer包–全平台可用 R语言gplots包的颜色索引表–全平台可用 R语言中的自带的调色板–五种–全平台…

(后续补充)vue+express、gitee pm2部署轻量服务器

首先 防火墙全部关闭算了 首先 防火墙全部关闭算了 首先 防火墙全部关闭算了 首先 防火墙全部关闭算了 首先 防火墙全部关闭算了 首先 防火墙全部关闭算了 关闭防火墙 systemctl stop firewalld 重新载入防火墙使设置生效 firewall-cmd --reload 后端的 pm2.config.cjs …

Centralized Feature Pyramid for Object Detection解读

Centralized Feature Pyramid for Object Detection 问题 主流的特征金字塔集中于层间特征交互,而忽略了层内特征规则。尽管一些方法试图在注意力机制或视觉变换器的帮助下学习紧凑的层内特征表示,但它们忽略了对密集预测任务非常重要的被忽略的角点区…