数据资产入表-数据治理-指标建设标准

       前情提要:数据价值管理是指通过一系列管理策略和技术手段,帮助企业把庞大的、无序的、低价值的数据资源转变为高价值密度的数据资产的过程,即数据治理和价值变现。上一讲介绍了标签标准设计的基本逻辑和思路。数据资产入表-数据治理-标签设计标准

本章重点讲解指标建设标准设计

       指标数据是为了基于场景出发,为了满足内部分析决策或者外部使用的一个高度凝练的数据结果集,指标数据标准是为满足管理指标生产过程、对基础类数据加工而产生的指标数据标准化规范。

       数据分析师或者数仓治理人员常常会听到”统计结果不对”、”这个指标没有”、”这个指标怎么用?”的灵魂拷问。在做了问题定位之后,除了真的指标缺失之外,还有以下三张情形:

       ①指标名称不规范:当指标生产了一段时间,有了初步沉淀后,发现存量指标的名称千奇百怪,各有各的风格,这个是在指标设计之初对于指标的命名没有做出对应的规范(做出规范的同时需要有工具支撑);

       ②指标重复建设:在盘点指标的过程中,发现指标因名称不规范、单位不规范等原因,同一个指标出现多次建设的情况;

       ③指标口径不清晰:在指标使用的过程中,发现指标命名长得相似,但是不知道具体含义,也不清楚哪个指标适用于哪个场景;

       因此需要构建一套指标数据标准,帮助我们在指标体系搭建的过程中和用户使用的过程中更为清晰明了。

指标数据标准建设

       指标数据标准是为满足内部分析管理需要和外部监管要求,对基础类数据加工而产生的指标数据标准化规范。指标数据标准通过基础属性、业务属性、技术属性和管理属性来描述指标数据规范化要求。--引用《JR/T0137-2017银行经营管理指标数据元》

指标类型

       指标的梳理还是离不开实体的确认,实体在指标体系中是指标统计的对象,在指标体系梳理的过程中,在业务的角度上把指标分为原子指标、复合指标、派生指标;

       原子指标:是针对实体对象的基础统计值;例如(企业数量)

       复合指标:是在原子指标的基础上,增加属性维度的统计;例如(杭州市:企业数量;杭州市:新成立企业数量)

       派生指标:是在原子指标、复合指标的基础上,进行复合计算的派生指标;例如(杭州市:企业数量累计同比)

指标体系搭建

       指标体系的搭建一般是业务运行一段时间后,对于明细数据有一定沉淀,且业务人员在实际业务管理过程中存在一定的场景需求之后,才有具体的指标体系搭建场景。指标体系搭建的步骤如下:

step1:场景/业务需求收集和调研

        在业务收集的过程中,需要用户明确的内容包含指标统计的场景描述、统计的时间范围、统计的类型(要当前值、同比值、累计值、环比值)、统计的区域(若业务上没有,可忽略),平常使用的频率,如果是金额维度,需要描述统计的单元;

step2:在收集和调研业务需求后,开始梳理指标体系,需要基于业务需求拆解核心信息

 ①确定原子指标:明确出来业务需求中需要统计的实体;

 ②确定复合属性:明确统计口径中包含的修饰维度,其中需要区分出常用修饰维度和使用率较低的属性;

 ③确定统计口径:基于需求确定统计时间、统计类型的口径;

 ④输出指标清单:基于上述的信息收集和梳理,生成版本号、构建指标名称模板、统计单位、计算类型、指标释义、指标计算规则、更新频率等;

  1. 版本号:是指本次指标逻辑操作的次数记录,一般依托于工具生成;
  2. 指标名称模板:在指标生产的过程中,一般不会一个个罗列指标进行生产,会采用group by 的逻辑分类统计,因此在我们输出需求清单的时候,可能不是实际的指标名称,而是指标名称的模板,需要在命名的时候给分类修饰词留下占位符;
  3. 指标类型:描述指标的类型是属于原子指标、复合指标,派生指标
  4. 业务标签:描述业务标签类型,业务标签类型背后可以映射一张标签结果表;
  5. 计算类型:指的是这个指标是基于count、sum、avg等类型计算而成;
  6. 指标释义:需要描述指标的统计维度,包含的必要维度有统计实体、参与统计的业务标签;
  7. 实体所在明细表:顾名思义是被统计实体的明细表表名;
  8. 计算规则:是指该指标的计算规则;
  9. 单位:描述指标的单位信息;
  10. 更新频率:指定指标计算的频率;结合明细表的更新频率,指标的计算频率要低于明细表的更新频率;
  11. 负责人:明确该指标的业务负责人名称;

 step3:推动开发和验收:基于输出的需求清单推动开发和验收上线;

指标梳理流程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/342723.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

stm32太阳能追光储能系统V2

大家好,我是 小杰学长 stm32太阳能追光储能系统V2. 增加了命令行交互和内置AT指令解析框架 (就是可以用电脑串口发送at指令控制板子的所有功能) 改动了spi 换成硬件 改动了硬件电源 增加了pcb原理图 附带上pcb源文件 增加了freertos 互斥锁…

node.js漏洞——

一.什么是node.js 简单的说 Node.js 就是运行在服务端的 JavaScript。 Node.js 是一个基于 Chrome JavaScript 运行时建立的一个平台。 Node.js 是一个事件驱动 I/O 服务端 JavaScript 环境,基于 Google 的 V8 引擎,V8 引擎执行 Javascript 的速度非常…

2024骨传导耳机品牌排行前五名汇总,揭晓年度最强王者骨传导机型!

骨传导耳机自问世以来,便迅速在蓝牙耳机市场中崭露头角,并且凭借特殊的传声方式和特健康的佩戴方式深得消费者的喜爱。然而,随着骨传导耳机逐渐热门,市场中品牌越来越多,也逐渐出现了一些劣质品牌,这些品牌…

Activity->Activity中动态添加Fragment->Fragment回退栈BackStack

Fragment回退栈 Fragment回退栈用于管理Fragment的导航历史(添加、删除、替换)。每个Activity都有一个包含其所有Fragment的FragmentManager,调用其addToBackStack方法时,这个事务就会被添加到FragmentManager的回退栈中当用户按下返回键时,…

关于计算机是如何工作的

计算机的发展历程 世界上的第一个计算机 冯诺依曼机构体系 1.存储器 (包括内存(存储空间小,访问速度快,成本高,掉电后数据丢失) 外存(硬盘,软盘,U盘,光盘)),存储空间小,访问速度慢,成本低,掉电后数据仍在 2.CPU(中央处理单元,计算机最核心的部分,用于算术运算和逻辑判断),…

【Python】教你彻底了解Python中的模块和包

​​​​ 文章目录 一、模块的概念1. 导入模块2. 导入特定对象3. 给模块或对象取别名 二、标准库模块1. 常用标准库模块2. 使用示例 三、自定义模块1. 创建模块2. 使用自定义模块 四、包的结构与使用1. 创建包2. 使用包中的模块 五、包的深入使用1. 相对导入2. 子包3. 使用子包…

【排序】冒泡排序

在我们的生活中,到处都离不开排序的作用,考试分数要排序,商场购物要排序,可以说排序对我们来说处处存在,那么从本章开始,我将要依次分享一些排序方法,从易到难,包括冒泡,…

CNN卷积神经网络

一、概述 卷积神经网络(CNN)是深度学习领域的重要算法,特别适用于处理具有网格结构的数据,比如说图像和音频。它起源于二十世纪80至90年代,但真正得到快速发展和应用是在二十一世纪,随着深度学习理论的兴起…

Apple开发者证书创建完整过程

1.创建CSR文件: 打开钥匙串访问程序 选择从证书颁发机构请求 创建证书 保存CSR文件到桌面 成功如下: 开始创建证书: 选择

分布式ID生成方式

1.UUID uuid方式存在问题:占用字节数比较大;ID比较随机,作为MySQL主键写入库时,为了保证顺序性将导致BTree节点分裂比较频繁,影响IO性能。 2.数据库方式 步长step 3,即为机器的数量。 第一台机器&#x…

web刷题记录(4)

[GKCTF 2020]cve版签到 进来应该是给了个提示了,就是要以.ctfhub.com结尾 还有一个超链接,这题的ssrf还是挺明显的,抓包看看 发现回显里面有提示 说是和本地有关,那么也就是说,要访问127.0.0.1,大概意思就…

项目实战系列——WebSocket——websock简介

最近项目中需要用到mes和本地客户端进行实时通讯,本来想用webapi进行交互的,但是考虑到高效和实时性,就采用这一项技术。 以往采用的方式——长轮询 客户端主动向服务器发送一个请求,如果服务器没有更新的数据,客户端…

大语言模型 (LLM) 窥探未来

随着2023年的岁月渐渐走向尾声,我们站在人工智能的前沿,回望大语言模型(Large Language Models, LLM)所走过的道路,同时也不禁展望未来。从初步尝试到成为人工智能领域的万千宠爱,一种又一种的技术突破&…

处理一对多的映射关系

一对多关系&#xff0c;比如说根据id查询一个部门的部门信息及部门下的员工信息 在Dept类中先添加List emps属性 1、collection DeptMapper.xml文件中 <resultMap id"deptAndEmpResultMap" type"Dept"><id property"did" column&qu…

[Redis]List类型

列表类型来存储多个有序的字符串&#xff0c;a、b、c、d、e 五个元素从左到右组成了一个有序的列表&#xff0c;列表中的每个字符串称为元素&#xff0c;一个列表最多可以存储个元素。在 Redis 中&#xff0c;可以对列表两端插入&#xff08;push&#xff09;和弹出&#xff08…

Postgresql中json和jsonb类型区别

在我们的业务开发中&#xff0c;可能会因为特殊【历史&#xff0c;偷懒&#xff0c;防止表连接】经常会有JSON或者JSONArray类的数据存储到某列中&#xff0c;这个时候再PG数据库中有两种数据格式可以直接一对多或者一对一的映射对象。所以我们也可能会经常用到这类格式数据&am…

【Linux】进程切换环境变量

目录 一.进程切换 1.进程特性 2.进程切换 1.进程切换的现象 2.如何实现 3.现实例子 2.环境变量 一.基本概念 二.常见环境变量 三.查询常见环境变量的方法 四.和环境变量相关的命令 五.环境变量表的组织方式 六.使用系统调用接口方式查询环境变量 1.getenv 2.反思 …

如何学习使用淘宝API?淘宝API运营场景

学习使用淘宝API涉及对其功能、分类、调用方法及实际应用的综合理解。下面按部分详细解释如何系统地学习和掌握淘宝API的使用&#xff1a; 淘宝API接口入门 了解淘宝开放平台&#xff1a;淘宝开放平台为开发者提供了一个可以与淘宝数据进行交互的平台&#xff0c;涵盖了丰富的A…

神经网络 torch.nn---优化器的使用

torch.optim - PyTorch中文文档 (pytorch-cn.readthedocs.io) torch.optim — PyTorch 2.3 documentation 反向传播可以求出神经网路中每个需要调节参数的梯度(grad)&#xff0c;优化器可以根据梯度进行调整&#xff0c;达到降低整体误差的作用。下面我们对优化器进行介绍。 …

uniapp内置的button组件的问题

问题描述 由于想要使用uniapp内置button组件的开放能力&#xff0c;所以就直接使用了button&#xff0c;但是他本身带着边框&#xff0c;而且使用 border&#xff1a;none&#xff1b;是没有效果的。 问题图片 解决方案 button::after {border: none;} 正确样式 此时的分享…