数据治理项目——深铁集团数据治理规划

目录

一、前言

二、数据治理内容与主要措施

2.1 实施背景

2.2 主要举措

2.2.1 制定数据战略目标

2.2.2 绘制数据治理蓝图

2.2.3 绘制数据治理制度

2.2.4 梳理数据资产目录

三、 应用效果

3.1 数据资产可视化管理

3.2 数据标准治理

3.3 集团大数据平台优化建设


一、前言

   深铁集团成立于1998年7月31日,是深圳市国资委直管的国有独资大型企业,承担着深圳90%以上的轨道交通建设和运营任务。为落实深圳市地铁集团有限公司(下文简称“深铁集团”或“集团”)数字化转型战略,摸清数据资产,统一数据标准,建立数据管控体系,形成数据管理的“深铁法典”,探索出一套具有深铁集团特色的数据标准体系,2021年,深铁集团启动数据治理专项(下文简称“项目”)。项目明确了深铁集团数据治理目标及愿景,绘制了1套覆盖13个核心业务领域的数据治理蓝图,编制了14个数据管理办法、7个数据管理规范以及6个数据设计报告,并盘点梳理出一份接近2万字段的数据资产目录,为后续持续推进深铁集团数据治理工作奠定坚实基础。

二、数据治理内容与主要措施

2.1 实施背景

  随着深铁集团业务的不断发展,信息系统对业务的涵盖不断扩大,应用逐步深入,企业数据规模快速增长,各业务板块积累了丰富的数据资源并打下部分数据管理基础。但是各类业务统计口径不统一,数据质量不高,数据孤岛严重等问题也逐步凸显,难以实现基于数据支撑的业务决策以及运营优化。

   为满足深铁集团经营管理精细化的需求、支持业务数据的分析及应用、促进企业数字化转型发展,亟需构建集团统一数据治理体系,建立相应的管理组织、制度、流程与保障体系,明确数据管控范围,拉通整合数据,以纲领化的要求指导、监督与管理各IT项目中涉及数据领域工作的建设与运维,实现对全集团数据资产管理的指导、监督和管理,确保数据规范、及时、准确和安全,为全面盘活企业数据资产奠定基础。

2.2 主要举措

  项目围绕数据治理工作方法论,建设内容包括:(1)基于现状梳理及对标分析,厘清数据治理战略目标;(2)结合行业经验及深铁集团实际需求,绘制数据治理整体框架及蓝图;(3)通过发布制度流程及技术规范为数据治理工作建章立制;(4)深度盘点各业务领域数据资产,编制跨业务,全链条的数据资产目录。

                              图1:数据治理项目工作方法论

2.2.1 制定数据战略目标

   项目通过问卷调研、现场访谈了解深铁集团业务、数据和数据治理的实际情况以及当前存在的数据问题,根据DCMM数据治理方法论,从内容建设,技术支撑与保障机制层面收集与发现当前深铁集团数据治理领域的现状和主要问题。同时参考同业实践情况,对深铁集团各数据治理领域的成熟度进行评估。

    项目分析发现,深铁集团数据治理问题主要集中在数据问题体现在数据壁垒多,数据共享和追溯困难,主数据管理薄弱,数据质量不高,数据应用处于起步阶段,综合数据治理水平接近于受管理级。虽然具备一定基础,但与行业领先者存在着一定差距,未来具备较大的提升空间,还需进一步提升和完善。

    为应对集团数据治理及共享应用诉求,解决当前面临的数据质量等问题,项目明确了“看的清”、“管的住”、“用的好”的数据治理目标。(1)对深铁数据资产进行盘点,识别核心资产,建立企业级数据资产目录,实现企业级数据能够“看得清”;(2)建立数据治理的组织,制度, 流程和评价考核机制,对数据标准,数据质量,数据安全的核心领域进行管理,实现企业数据能够“管得住”;(3)建立数据应用,利用集团统建的数据平台及相关工具,进行数据分析,展示和共享,实现企业数据能够“用得好”

   基于深铁集团未来业务发展及战略要求,项目明确了集团数据治理的愿景,即应实现对业务运营、业务创新、业务转型的数据赋能。(1)依托大量历史数据的积累,梳理、整合具有分析价值的数据资产,服务于企业经营持续优化,形成数据驱动业务质效提升的新格局,“赋能运营”;(2)依托乘客数据、运行数据的积累,借助客户画像、数据挖掘等技术,深入了解乘客偏好和迫切需求,服务于深铁集团技术服务体系创新,形成数据引领的业务创新的新模式,“赋能创新”;(3)依托行业数据洞察和生态合作伙伴数据共享,分析轨交行业发展趋势,服务于深铁集团业务转型和运营模式升级,形成数据决策业态转型的新体制,“赋能转型”。

                              图2:深铁集团数据治理目标及愿景

2.2.2 绘制数据治理蓝图

  项目以深铁集团数据治理目标为导向,围绕数据全生命周期管理,从数据管理和服务能力的整体角度出发,设计了深铁集团“1+3+1”的数据治理蓝图框架,即1份目录、3套体系、1组平台

1份目录:即深铁集团数据资产盘点及数据资产目录。

  在充分理解数据资产概念的基础上明确全集团的数据资产,梳理数据对象及属性(包括业务属性、技术属性和管理属性等),形成一套可快速准确检索的企业级数据资产目录。

3套体系:

  • (1)数据管理体系,对数据管理和服务行使权力及其控制的活动集合,在数据管理和服务层面之上进行规划、监督和控制,为数据技术体系、数据应用与服务体系提供保障;
  • (2)数据技术体系,涵盖数据治理过程中的各项具体举措,是数据治理框架的核心内容,包含数据架构管理,数据标准管理,数据质量管理,主数据管理,元数据管理、数据安全管理、数据生命周期管理、数据需求管理、数据运维管理和数据应用绩效管理十个领域的内容;
  • (3)数据应用与服务体系,即涵盖数据运用与数据资产价值实现的各项活动,数据应用与服务从数据采集服务、报表查询服务、数据分析挖掘服务以及数据应用体系建设等领域进行数据应用与服务能力的提升和改进

1组平台:即数据支撑平台

   平台是数据治理工作的技术支撑,实现数据资产管理与数据治理、基于数据的业务决策支持、精细化运营分析等相关要求,主要包括数据资产管理平台、数据服务共享平台和数据智能分析平台

   基于“1+3+1”的数据治理框架指引以及集团数据应用与服务体系,全面绘制了深铁集团未来数据治理的工作蓝图。在平台建设层面,项目基于“一切业务数据化,一切数据业务化”的理念,采用“集数据、建标准、创平台、拓应用”四步法进行深铁集团数据平台设计,规划了深铁集团三大数据平台的核心能力及系统边界,为后续深铁集团数据平台建设指明方向。

                    图3:深铁集团数据治理蓝图框架

2.2.3 绘制数据治理制度

    项目编制了包括《深铁集团数据资产管理总纲》、《深铁集团数据定义管理办法》等在内的15个数据管控制度流程,以及包括《深铁集团数据安全规范》、《深铁集团数据资产规范》等在内的7个数据标准管理规范,从制度流程层面,全面搭建深铁集团数据治理框架,为各类数据治理工作建章立制,支持后续集团数据治理工作的有序开展。

2.2.4 梳理数据资产目录

    数据资产是开展数据治理的关键对象,数据资产目录是数据架构设计的重要基础,而数据资产盘点是数据资产管理的前提。通过对数据资产进行规范化、系统化的归并、整理、分类等操作,编制了深铁集团企业级数据资产目录,充分厘清集团数据情况,逐步推进数据资产应用。

   数据资产盘点主要分为业务属性盘点,即将业务过程产生的数据与业务流程进行匹配,梳理企业经营过程产生的全部数据资产,明确“数据有哪些”技术属性盘点,即明确数据在业务系统的分布情况,同时,梳理各数据的技术规则,明确“数据在哪里”管理属性盘点,即明确各盘点数据的部门及岗位归属,梳理企业数据管理现状,明确“数据谁在管”。

    项目深入调研并全面盘点了从L1(主题域分组)到L5级(字段级)的集团数据资产清单,为数据资产目录的梳理奠定基础。基于数据资产盘点成果以及深铁集团全业务能力框架梳理核心端到端流程,提取了核心流程共性数据对象,完成包含5个L1级主题域分组、34个L2级主题域、405个L3级业务对象、2503个L4级逻辑数据实体、19107个L5级数据资产项的集团首个数据资产目录编制,覆盖了深铁集团所有核心业务环节。针对各板块共性的采购,人力,财务管理等业务领域,实现了数据对象的归纳合并,规避了系统孤岛下造成的数据资产割裂等问题。同时制定了数据认责方案,明确了各类数据资产,数据责任部门,支持未来长效化、常态化数据资产盘点、维护及更新的工作要求。

                    图4:深铁集团数据资产目录结构

三、 应用效果

    深铁集团通过数据管理办法及数据管理规范为抓手,全面推进各类业务部门对数据治理蓝图的实施落地,并结合集团信息项目管理要求,落实各类系统建设及运维优化过程中的数据治理工作。此外,深铁集团着重考虑从数据资产可视化管理、数据标准治理、集团大数据平台优化建设等方面专项推进数据治理蓝图实施落地工作,逐步实现基础数据的可视、可用、可管理,为后续多场景、多维度数据应用奠定基础。

3.1 数据资产可视化管理

   承接项目盘点梳理的数据资产目录成果,深铁集团同步建设了数据资产目录管理系统,承载了集团的数据资产目录管理要求并对外提供查询服务,规范集团各单位对数据资产目录的管理维护操作,使数据资产目录的管理条理化,可视化,规范化,流程化,实现数据资产在各单位及部门间的共享,融合及使用。目前系统已正式上线投入使用,支持全集团级员工对数据资产、数据标准的浏览及管理。

                    图5:深铁集团数据资产目录管理系统

3.2 数据标准治理

    承接项目设计并正式发布的《数据标准规范》及《数据标准管理办法》,统一各单位数据语言,推进跨部门数据的互通与共享。

   目前已完成“员工”、“合同”、“会计科目”、“线路”、“站点”、“枢纽”等核心主数据的数据标准编制。其中着重统一了相关数据对象的编码规则及分类标准,同时梳理了集团通用属性字段及各业务的业务自有字段,针对相关字段明确定义了其业务属性、技术属性、管理属性,从业务口径层面(包括字段名称、业务定义等)、技术口径层面(数据类型、数据长度、数据精度等)、管理口径层面(标准责任部门等)实现了全集团的统一。此外,以相关标准为法则,各业务及系统也在逐步推进落标、贯标及历史数据质量清洗工作,持续落实集团“赋能运营”、“赋能创新”、“赋能转型”的数据治理工作愿景。

3.3 集团大数据平台优化建设

    结合项目技术平台规划方案,深铁集团持续优化大数据平台技术能力及应用范围,对内实现关键系统数据采集、数据共享,实现互联互通,提高应用系统部署效率,节约部署成本对外提供统一的数据接口服务,实现与外部市国资委和政数局等单位数据共享。同时,集团大数据平台作为资源管理抓手的一部分,将数据集成标准作为新建IT项目的竣工验收标准之一,对新建或改造信息化系统制定了统一数据集成、入湖标准,实现了数据集成的统一管理,不断提升集团整体数据质量,为跨单位、跨平台的数据共享及多元化数据分析应用奠定基础。

参考文章:

深铁集团数据治理规划项目

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/306480.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

若依vue中关于字典的使用

文章目录 字典管理页面列表点击某个字典类型展示具体字典数据修改某一条字典数据 字典的应用一般用于select多选框中代码实现根据字典Dict的value获取Label,类似于通过key获得value 源码解析 字典管理页面 列表 点击某个字典类型展示具体字典数据 修改某一条字典数…

力扣HOT100 - 189. 轮转数组

解题思路: 三次反转。 先反转一次,再根据 k 拆分成两部分各反转一次。 class Solution {public void rotate(int[] nums, int k) {k % nums.length;reverse(nums, 0, nums.length - 1);reverse(nums, 0, k - 1);reverse(nums, k, nums.length - 1);}pu…

关于DNS解析那些事儿,了解DNS解析的基础知识

DNS,全称Domain Name System域名系统,是一个将域名和IP地址相互映射的一个分布于世界各地的分布式数据库,而DNS解析就是将域名转换为IP地址的过程,使人们可以轻松实现通过域名访问网站。DNS解析是网站建设非常关键的一步&#xff…

防火墙搭建内网 安装路由器

经典网络情况 也就是网吧 先配置网段 科普:子网掩码代表IP前面几位不能动 安装防火墙虚拟机 配置两个网卡 第一个 第二个桥接 设置子网掩码 虚拟机有DHCP 可以不用防火墙的DHCP 配置有网站的ip地址和网关 利用防火墙映射出去外网 然后看防火墙外网ip 然后…

[lesson20]初始化列表的使用

初始化列表的使用 类成员的初始化 C中提供了初始化列表对成员变量进行初始化 语法规则 注意事项 成员的初始化顺序与成员的声明顺序相同成员的初始化顺序与初始化列表中的位置无关初始化列表先于构造函数的函数体执行 类中的const成员 类中的const成员会被分配空间的类中…

C++ primer 第十八章

C语言的三大特性:异常处理、命名空间、多重继承。 1.异常处理 异常处理机制允许我们能够将问题的检测与解决过程分离开来。 1.1、抛出异常 在C语言中,我们通过抛出一条表达式来引发一个异常。 当执行一个throw时,程序的控制权从throw转移…

(学习日记)2024.04.12:UCOSIII第四十节:软件定时器函数接口讲解

写在前面: 由于时间的不足与学习的碎片化,写博客变得有些奢侈。 但是对于记录学习(忘了以后能快速复习)的渴望一天天变得强烈。 既然如此 不如以天为单位,以时间为顺序,仅仅将博客当做一个知识学习的目录&a…

ArcGIS和ArcGIS Pro快速加载ArcGIS历史影像World Imagery Wayback

ArcGIS在线历史影像网站 World Imagery Wayback(网址:https://livingatlas.arcgis.com/wayback/)提供了数期历史影像在线浏览服务,之前不少自媒体作者在文中宣称其能代表Google Earth历史影像。 1、一点对比 (1)同一级别下的版本覆盖面 以下述区域为例,自2014年2月20…

java 邮件发送表格

邮件发送表格 问题导入效果图 实现方案1. 拼接HTML文件(不推荐)2. excel 转HTML使用工具类来转化依赖工具类代码示例 使用已工具包 如 aspose-cells依赖代码示例 3.使用模板生成流程准备模板工具类代码示例 问题导入 在一些定时任务中,经常会…

liunx环境变量学习总结

环境变量 在操作系统中,环境变量是一种特殊的变量,它们为运行的进程提供全局配置信息和系统环境设定。本文将介绍如何自定义、删除环境变量,特别是对重要环境变量PATH的管理和定制,以及与环境变量相关的函数使用。 自定义环境变…

《哈迪斯》自带的Lua解释器是哪个版本?

玩过《哈迪斯》(英文名:Hades)吗?最近在研究怎么给这款游戏做MOD,想把它的振动体验升级到更高品质的RichTap。N站下载了一些别人做的MOD,发现很多都基于相同的格式,均是对游戏.sjon文件或.lua文…

LeetCode-64. 最小路径和【数组 动态规划 矩阵】

LeetCode-64. 最小路径和【数组 动态规划 矩阵】 题目描述:解题思路一:动态规划五部曲。定推初遍举解题思路二:动态规划优化空间,直接改grid解题思路三:dfs 题目描述: 给定一个包含非负整数的 m x n 网格 …

Python代码识别minist手写数字【附pdf】

一、概述 对于人类而言,要识别图片中的数字是一件很容易的事情,但是,如何让机器学会理解图片上的数字,这似乎并不容易。那么,能否找出一个函数(模型),通过输入相关的信息&#xff0…

最新版手机软件App下载排行网站源码/App应用商店源码

内容目录 一、详细介绍二、效果展示1.部分代码2.效果图展示 三、学习资料下载 一、详细介绍 一款简洁蓝色的手机软件应用app下载排行,app下载平台,最新手机app发布网站响应式织梦模板。 主要有:主页、app列表页、app介绍详情页、新闻资讯列…

Linux虚拟网络设备:底层原理与性能优化深度解析

在深入探讨Linux虚拟网络设备的底层原理之前,重要的是要理解这些设备如何在Linux内核中实现,以及它们如何与操作系统的其他部分交互以提供高效且灵活的网络功能。虚拟网络设备在现代网络架构中发挥着关键作用🔑,特别是在云计算☁️…

LeetCode-1143. 最长公共子序列【字符串 动态规划】

LeetCode-1143. 最长公共子序列【字符串 动态规划】 题目描述:解题思路一:动规五部曲解题思路二:1维DP解题思路三:0 题目描述: 给定两个字符串 text1 和 text2,返回这两个字符串的最长 公共子序列 的长度。…

关于转义符 \ 在php正则中的匹配问题

今天做题遇到一个很经典的问题&#xff0c;记录一下&#xff0c;先看一段代码 <?php $str&#xff0c;&#xff0c;"\\"; $pattern&#xff0c;&#xff0c;"/\\/"; if(preg_match($partern,$str,$arr)) { &#xff0c;&#xff0c;&#xff0c;&…

windows wireshark抓包rtmp推流出现TCP Retransmission

解决办法&#xff1a;tcp.port1935 && !(tcp.analysis.retransmission)

每日一题---OJ题: 合并两个有序链表

嗨!小伙伴们,好久不见啦! 今天我们来看看一道很有意思的一道题---合并两个有序链表 嗯,题目看上去好像不难,我们一起画图分析分析吧! 上图中,list1有3个结点,分别为1,2,3 ; list2中有3个结点,分别为1,3,4, 题目要求我们要将这两个链表合并到一起,并且是升序,最后将链表返回。 …

使用DSP28335在CCS中生成正弦波

DSP芯片支持数学库&#xff0c;那如何通过DSP芯片生成一个正弦波呢&#xff1f;通过几天研究&#xff0c;现在将我的方法分享一下&#xff0c;如有错误&#xff0c;希望大家及时指出&#xff0c;共同进步。 sin函数的调用 首先看下一sin函数 的使用。 //头文件的定义 #includ…