中信建投在金融电于化期刊发布 DataOps 实践

文 ‖ 中信建投证券股份有限公司 马丽霞 高宇航 李可 许哲 李海伟

file

近年来,数据的分析和应用对各行各工业的业务模式和竞争形态进行重塑,而积极应对挑战和顺应时代变化是各个市场参与者的必选项。作为资本市场数字化转型的领航者,中信建投证券重视数字化转型机遇,陆续启动了各业务领域的数字化转型建设。

DataOps 作为近年来数据管理领域兴起的工程文化和实践,借用了 DevOps 敏捷交付的基础框架,揉合了 DAMA 数据治理理念,强调在如此激烈竞争的商业环境下,最大限度地快速匹配业务部门的需求和资源开展交付,加速业务价值的试验与试错,持续实现数据价值。

为高质量服务公司数字化转型,中信建投证券于 2021 年正式启动 DataOps 能力建设,结合公司现状打造了 DataOps 研发管理创新体系,梳理优化需求、设计、开发、测试、投产的全过程及相关支撑工具的整合,逐步建立了标准化、全线上流水线,支持数据持续集成和交付,为数据供给提供效率和质量的双重保障,支撑公司数字化转型。

基于DataOps的券商数据平台与应用服务体系建设

1. 面向“汇聚共享”的数据底座

中信建投证券建设了信创化的云原生湖仓一体数据底座。该平台是将数据湖的灵活性和数仓的易用性、规范性、高性能结合起来的融合架构,是公司打造的新代数据底座,满足了数据高效汇聚、数据算力灵活扩展、资源隔离的需求。

file

通过建设数据底座,打破了公司数据“烟囱”壁垒,将公司内外部的数据汇聚在一起,并参考证券行业SDOM数据模型结合公司数据标准规范和实际情况,对数据进行重新清洗、整理、组织和联系,逐步形成公司级的高质量、可信的、标准化的产品、客户、机构等共性数据,为经营分析、风控等数据消费提供数据供给。

同时探索建立指标标签管理体系,在共性数据的基础上,数据底座还构建了指标标签工厂。一方面推动指标标签的定义归集、计算(结果)归集和服务归集 ;另一方面通过解耦指标标签需求与数据开发,通过提供统一语义层,下游数据消费者可以方便地将业务语言转换为技术语言,快速实现业务服务。

2. 建设“服务化”的数据中台

搭建企业级数据能力框架,弥合数据供需鸿沟,用户不需关注数据架构和技术只需关注业务实现,快速响应数据需求数据中台服务化分为数据技术服务化和数据服务化。

数据技术服务化通过搭建数据基础能力平台,为用户提供开箱即用的数据开发能力。为此,数据中台构建了数据开发中心和数据基础服务中心。

数据开发中心:构建统一、标准化的一站式数据开发协作平台,完成采集、建模、加工、测试、调度、发布、监控功能的整合和集成,降低数据开发门槛,提升开发运维效率。中信建投联合白鲸开源基于WhaleScheduler产品基础上打造了全栈信创化的数据开发平台,实现统一数据开发、任务编排、任务调度,更好地完成了离线批处理、实时流处理等任务,有效峰低了数据加工处理成本,真正实现精益敏捷的数据运营。

数据基础服务中心:数据中台搭建了AI、BI、图计算、OLAP、实时计算等基础服务集群,封装了对应的数据服务能力,满足各种业务场景对计算能力的要求,帮助下游系统快速构建数据应用。

“数据服务化” 体现为封装数据底座数据应用的数据接口,提供服务化的数据调用介入方式。为此,数据中台构建了数据服务中心和数据资产中心。

数据服务中心:在数据安全合规的前提下,将数据以API、文件等形式开放供业务流程调用、下游系统交换数据使用。

数据资产中心:建设数据门户,提供企业级数据资源访问入口和数据工作展示服务窗口。将数据资产目录建设为公司级的数据资产查询和操作系统,解决数据“是什么,在哪里”的问题,具备向数据服务引流的能力,支持数据应用。同时整合公司各项数据能力,打造数据工具箱,面向不同用户提供不同的数据能力服务,着力解决数据“怎么用”的问题。

3. 打造“敏捷高效”的数据产品交付中心

数据需求方面,通过“两归口”实现需求统筹管理。一方面,发挥SI制度优势由业务部门SI归口本部门数据需求,从源头上规范数据需求:另一方面,组织数据专家形成评审委员会,对重点项目重点需求开展评审,借助专家经验不断提升交付质量。

数据研发方面,通过一站式数据开发协作平台与公司DevOps持续交付体系结合起来,数据开发协作平台统一对接Gitlab进行代码托管,将各种数据任务类型构建数据研发流水线,提高数据研发效率和交付能力。同时,数据研发过程引入数据模型管控,通过对接数据模型管理工具,实现数据模型设计标准化。

CI/CD方面,数据流水线通过持续集成插件自动化进行代码规范扫描、业务规则测试、测试报告生成,满足数据测试质量要求版本后,运维人员可以一键确认和发布,极大节省了测试和运维工作量,提升了版本发布效率和成功率,实现了数据产交付的标准化规范化。数据研发流水线可以实现开发、测试和部署的多重保障降本增效,提升大规模数据需求交付能力实现数据价值快速输出。

4.面向“自助消费”的数据服务体系

传统的企业数据需求很大一部分是通过内部数据查询单的模式触发数据分析工作,由于开发人员工作排期及需求理解等问题,分析需求需要多轮迭代才能完成导致数据分析的时效性低。针对这一问题中信建投证券探索建立自主消费的数据服务体系。

从工具层面,基于数据中台打通了数据探源、整合及分析展现的整个链路构建自助分析体系,通过可视化低代码开发代替专业工具代码开发将以往的开发门槛大大降低。通过数据自助分析,业务用户可以更快速地进行数据探查和分析模型迭代,极大提高了数据分析的时效性。

从制度文化层面,持续开展数据分析师培训,帮助更多人建立数据思维。从人力资源层面,以数据中台为依托,举办数据分析师培训及作品评比比赛,通过作品评选挖掘发现潜在种子用户、种子部门逐步建立企业数据分析师团队。

5.构建“智能”数据管理与运营平台

(1)价值驱动的数据交付。倡导由数据价值驱动的数据开发运营,评估数据产品的业务价值和经济价值。企业数字化的目标是要建立长期目标和规划的,以关键项目为抓手,集中最优势的资源,攻坚克难,解决业务发展中最迫切的数智化要求。

(2)开发治理一体化。遵从源头管控的原则,积极开展数据治理并将相关动作尽量前置,并与数据的研发工艺有机结合.在数据产生阶段即开展数据治理。通过数据开发和治理的统一规划管理,推动数据汇聚和标准化,强化大数据融合分析。

(3)运营管理一体化。数据产品的强大生命力,一方面依赖于高质量的数据数据研发;另一方面通过收集和挖摇用户需求,以及实际的使用效果和反馈,不断优化迭代数据产品,将其建设为业务级甚至是公司级的重量级数据产品,实现数据运营与研发管理的协同。

未来展望

DataOps能力体系的建设是一个不断打磨、精益求精的过程,中信建投证券将在不断探索和总结中持续前行,为公司数字化转型提供更多动力和支持。

一是加强业务赋能。围绕关键数据应用和场景、数据组织,借助DataOps开展持续集成交付,提高数据仓库、数据中台等平台类工程建设的ROI,实现数据组织协作效能最大化,帮助企业实现数字化转型。

二是聚焦内功、不断进化。目前DataOps理念和方法论还在不断演进中因此,需积极对标最佳实践,完善我司DataOps体系,同时也会积极参与相关标准的制定和推广工作。

file

文章来源于金融电子化第355期期刊

本文由 白鲸开源科技 提供发布支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/206326.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【JMeter】菜单栏介绍

【菜单栏】 1. Tools 导入curl接口信息 作用&#xff1a;快速导入接口信息&#xff0c;响应头和缓存信息等 Log level临时修改日志等级 作用&#xff1a; 从勾选的level开始往更高等级level抓取log日志等级优先级&#xff1a; ALL < TRACE < DEBUG <INFO<WA…

赛题详解第二弹|215G数据集,148w奖金!2023无锡国际人工智能算法大赛

各位人工智能卓越的推动者们&#xff0c;我们诚邀您参与【2023年无锡国际人工智能算法大赛】&#xff0c;探索未来AI创新的巅峰之战&#xff01; 报名链接&#xff1a;https://sourl.cn/sYXEH2 【大赛进程】 12月11日12:00&#xff1a;报名及初赛截止 12月12日-12月15日&…

python爬虫实习找工作练习测试(以下内容仅供参考学习)

要求&#xff1a;获取下图指定网站的指定数据 空气质量状况报告-中国环境监测总站 输入&#xff1a;用户输入下载时间范围&#xff0c;格式为2022-10 输出&#xff1a;将更新时间在2022年10月1日到31日之间的文件下载到本地目录&#xff08;可配置&#xff09;&#xff0c;并…

浏览器如何读取本地Excel表格

浏览器可以读取Excel表格数据吗&#xff1f; 答案是否定的&#xff0c;目前主流浏览器都无法打开本地Excel文档。 答案也是肯定的&#xff0c;这就来看看具体实现方法&#xff01;&#xff01;&#xff01; 首先准备一个Excel表格文件 保存在D:\\temp\测试表.xls…

MySQL基本SQL语句(下)

MySQL基本SQL语句&#xff08;下&#xff09; 一、扩展常见的数据类型 1、回顾数据表的创建语法 基本语法&#xff1a; mysql> create table 数据表名称(字段名称1 字段类型 字段约束,字段名称2 字段类型 字段约束,...primary key(主键字段 > 不能为空、必须唯一) ) …

C++类与对象(5)—流运算符重载、const、取地址

目录 一、流输出 1、实现单个输出 2、实现连续输出 二、流输入 总结&#xff1a; 三、const修饰 四、取地址 .取地址及const取地址操作符重载 五、[ ]运算符重载 一、流输出 1、实现单个输出 创建一个日期类。 class Date { public:Date(int year 1, int month 1,…

PLC:200smart(13-16章)

PLC&#xff1a;200smart 第十三章2、带参子程序3、将子程序设置成库文件 第十三章 项目ValueValue主程序MAIN一个项目只能有一个&#xff0c;循环扫描子程序SBR_0项目中最多有128个&#xff0c;只有在调用时 才执行&#xff08;子程序可以嵌套其他子程序&#xff0c;最多八层…

【经验分享】开发问题记录总结(持续更新)

目录 工具开发 界面类继承某自定义界面类时&#xff0c;出现布局混乱或者所有控件集中在左上角&#xff1f; 在继承自定义界面之后&#xff0c;以诸如 on_xxx_clicked() 模式设计的槽函数失效了? 使用pugi接口取出文本数据后&#xff0c;为什么该变量无法进行字符串比较&…

QT 项目中添加文件夹(分类文件)

为了更方便的整理项目的文件&#xff0c;添加文件夹把文件进行分类。 1.首先在项目文件中创建新的文件夹 2.把需要归类的文件放入新建的文件中 3.右键然后选择add..... 4.运行此程序&#xff0c;会报错因为文件路径改变了&#xff0c;需要在.pro中修改路径 注意事项 文件夹内部…

CSS之弹性盒子Flexible Box

我想大家在做布局的时候&#xff0c;没接触flex布局之前&#xff0c;大家都是用浮动来布局的&#xff0c;但现在我们接触了flex布局之后&#xff0c;我只能说&#xff1a;“真香”。让我为大家介绍一下弹性盒子模型吧&#xff01; Flexible Box 弹性盒子 在我们使用弹性盒子时&…

【Docker】从零开始:11.Harbor搭建企业镜像仓库

【Docker】从零开始&#xff1a;11.Harbor搭建企业镜像仓库 1. Harbor介绍2. 软硬件要求(1). 硬件要求(2). 软件要求 3.Harbor优势4.Harbor的误区5.Harbor的几种安装方式6.在线安装(1).安装composer(2).配置内核参数,开启路由转发(3).下载安装包并解压(4).创建并修改配置文件(5…

如何在VS2022上的MFC项目中操作Excel(VS2010、VS2012、VS2015、VS2017、VS2019使用方法一样)

先决条件 本机安装office2003、2007、2010、2016及以后版本&#xff0c;总之必须安装office导入Excel库文件&#xff0c;导入方式可参考&#xff1a; 如何在vs2017及以前版本(vs2010、vs2015)上添加 添加类型库中的MFC类如何在vs2019及以后版本(如vs2022)上添加 添加ActiveX控…

Python面试破解:return和yield的细腻差别

更多Python学习内容&#xff1a;ipengtao.com 大家好&#xff0c;我是涛哥&#xff0c;今天为大家分享 Python面试破解&#xff1a;return和yield的细腻差别&#xff0c;全文3000字&#xff0c;阅读大约10钟。 在Python的函数编程中&#xff0c;return和yield是两个常用的关键词…

UEditor编辑器实现上传图片自动加水印功能PHP源码

UEditor编辑器是百度旗下的免费开源富文本编辑器,使用很方便,但是也有缺点,比如,上传图片不能自动添加水印,下边我们就来说说如何在UEditor编辑器中自动实现上传图片添加水印功能,操作很简单。 首先找到UEditor/PHP目录下的Uploader.class.php的文件,打开该文件,找到以…

Java高级技术(单元测试)

一&#xff0c;概括 二&#xff0c;junit 三&#xff0c;案例 &#xff08;1&#xff09;&#xff0c;实验类 package com.bilibili;public class Name {public static void main(String name) {if (name null){System.out.println("0");return;}System.out.print…

Java(七)(Lambda表达式,正则表达式,集合(Collection,Collection的遍历方式))

目录 Lambda表达式 省略写法(要看懂) 正则表达式 语法 案例 正则表达式的搜索替换和分割内容 集合进阶 集合体系结构 Collection Collection的遍历方式 迭代器 增强for循环 Lambda表达式遍历Collection List集合 ArrayList LinkedList 哈希值 HashSet底层原理 …

2023 BUCT 计算方法实验报告

前言 Textlive版本&#xff1a;2023 textstudio版本&#xff1a;4.6.3 名字和日期在以下地方修改: 图片下载地址; figures.zip LiangCha_Xyy/Source - Gitee.com 如下图&#xff0c;.tex文件和figures文件夹放在同一路径下即可 .tex代码 \documentclass[UTF8]{ctexart} \usep…

软件测试编写文档模板【附文档模板】

一、测试岗位必备的文档 在一个常规的软件测试流程中&#xff0c;会涉及到测试计划、测试方案、测试用例、测试报告的编写&#xff0c;这些文档也是软件测试岗位必须掌握的文档类型。 1、测试计划 测试计划是组织管理层面的文件&#xff0c;从组织管理的角度对一次测试活动进…

Hive内置表生成函数

Hive内置UDTF 1、UDF、UDAF、UDTF简介2、Hive内置UDTF 1、UDF、UDAF、UDTF简介 在Hive中&#xff0c;所有的运算符和用户定义函数&#xff0c;包括用户定义的和内置的&#xff0c;统称为UDF&#xff08;User-Defined Functions&#xff09;。如下图所示&#xff1a; UDF官方文档…

揭示堆叠自动编码器的强大功能 - 最新深度学习技术

简介 在不断发展的人工智能和机器学习领域&#xff0c;深度学习技术由于其处理复杂和高维数据的能力而获得了巨大的普及。在各种深度学习模型中&#xff0c;堆叠自动编码器[1]作为一种多功能且强大的工具脱颖而出&#xff0c;用于特征学习、降维和数据表示。本文探讨了堆叠式自…