什么是标签?跟数据中台有什么关系?终于有人讲明白了

导读:本文带你了解标签在数据中台中的位置。

作者:任寅姿 季乐乐

来源:大数据DT(ID:hzdashuju)

01 什么是标签

标签指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体。从本质上讲,标签本身也是一种数据(或映射指向数据),它是对物理层数据信息项的业务化封装,是数据资产的一种良好组织形式,是一种概念、逻辑定义,因此标签必须是可阅读、易理解的。

从粒度上来讲,标签往往映射为某一对象的属性,包括固有属性和动态属性,一般都需要结构化到字段粒度,保障可被后续数据服务便捷使用。它面向数据应用的业务端,核心解答的是数据怎么用、资产价值在哪里的问题。根据加工方式的不同,标签可以分成基础类标签、统计类标签和算法类标签。

02 什么是数据中台

伴随着云计算、大数据、人工智能等技术的快速发展,企业数字化、智能化转型步伐逐渐加快。

数据中台是2018年逐渐兴起的数据概念,核心要义在于增援未来,以发展的眼光解决企业未来可能面临的各种场景问题。面对不确定的未来,企业需要组织沉淀可复用的标签资产,加强数据服务能力,构建出自己的数据中台,才能符合数字化转型的时代要求。

定义角度看,数据中台是一套可持续“让企业数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,以有形的产品和实施方法论为支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。

架构角度看,数据中台上承业务数据积累,通过自己的数据平台工具,将原始数据加工成数据资产,并通过数据资产服务化下启数据应用场景,帮助业务端或管理端降本增效。数据中台不只是一套生产加工的流程,它对企业的战略定位、组织保障、基础设施等方面都产生了深远的影响,如图2-14所示。

▲图2-14 数据中台架构图

实施角度看,数据中台是以数据资产为核心,以实现数据资产可见、可懂、可用、可运营的系列目标为出发点,配以平台工具、流程规范、应用建设等必要环节,最终落地的数据解决方案,如图2-15所示。

▲图2-15 以数据资产为核心的实施配套

03 标签在其中的重要位置

将企业的完整技术架构图抽丝剥茧,可以看到“标签”在数据中台中的具体位置:数据中台位于云底座与上层业务应用之间,即位于稳定厚重的技术大后台与灵活多变的业务小前台之间。通过数据中台对底层复杂技术能力的抽象封装,前端业务可以自由、轻便地使用数据能力,弥合前后端步伐不一致的问题。

在数据中台内部,具体又细分出开发工具层、数据资产层、资产管理层、数据服务层、数据运营体系、数据安全体系等模块,如图2-16所示。

▲图2-16 标签在数据中台中的位置

原始汇入的数据通过开发工具层转变为企业自有的数据资产;在资产管理层对数据资产进行不断的治理优化;最终通过资产服务化将数据资产输送到业务各端,实现数据价值;统一的运营体系和标准安全管理主要从流程机制层面保障整个数据中台的平稳有序运行。

在数据中台中,开发或管理工具是可以直接采购的,运营体系和标准安全规范的方法论是可以学习的,但是数据资产和数据服务必须是企业自行建设和实施的结果,它们是数据中台的核心部分,没有捷径可走。

数据资产和数据服务中最核心的是标签:数据资产本身以标签为组织载体,而数据服务本质上是一种将标签传递给业务端使用的价值管道。标签是数据中台价值链路中“核心的核心”。

关于作者:任寅姿(花名:影姿),资深产品总监、数澜研究院院长拥有超过10年的数据产品经验,原阿里巴巴集团数据产品专家,曾负责集团消费者标签类目体系、DMP精准营销等系统的数据资产设计与实施。2016年加入数澜科技,负责管理公司产品团队,系统提升团队数据思维、数据资产设计能力及数据服务应用经验,是数据中台理论定义及体系构建的核心参与者。

季乐乐(花名:寒泉),政法行业资深专家、产品专家拥有超过6年的政法行业产品经验,原南京通达海区域负责人,专注于研究数字检务、智慧法院等领域。

本文摘编自《标签类目体系:面向业务的数据资产设计方法论》,经出版方授权发布。

延伸阅读《标签类目体系》

点击上图了解及购买

转载请联系微信:DoctorData

推荐语:标签类目体系是数据中台理念落地的核心组成部分,是实现数据资产可复用、柔性组合使用、降低数据应用试错门槛的强力支撑。本书旨在培养资深的数据资产架构师及数据运营专家,以方法教育而非工具实施的方式助力企业建立自身的数据资产化能力,将数据能力最大限度地转化为商业价值。

活动预告????

▲长按识别二维码报名,活动详情请戳这里

干货直达????

  • 最新!全球学术排名出炉:22所中国大学位居世界100强

  • 制作PPT的7条黄金法则

  • 手把手教你用ECharts画散点图和气泡图

  • 任正非:芯片砸钱不行,得砸数学家!这些经典教材你最需要!

更多精彩????

在公众号对话框输入以下关键词

查看更多优质内容!

PPT | 读书 | 书单 | 硬核 | 干货 讲明白 | 神操作

大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化

AI | 人工智能 | 机器学习 | 深度学习 | NLP

5G | 中台 | 用户画像 1024 | 数学 | 算法 数字孪生

据统计,99%的大咖都关注了这个公众号

????

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/50523.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据中台:前台调用能快速响应、数据口径一致

标签类目体系方法有什么用处? 标签类目体系方法有什么用处?对企业来说究竟有什么好处?企业数据部门人员经常会对标签类目体系存在的意义产生疑问。如果不建设标签类目体系,用传统的数仓建模是否也可以?数据部门负责人在…

数据中台、标签、数据资产相关的15个名词解释

导读:本文将对数据中台、数据、标签相关的关键名词术语进行定义和解释。 作者:任寅姿 季乐乐 来源:大数据DT(ID:hzdashuju) 01 数据 数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的…

关于XML解析报错问题(LF、CRLF)

报错内容的主要部分: UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 123: illegal multibyte sequence 问题产生 在做目标检测时,使用的数据集来自网络,在将xml和图片转换到特定格式时,有些xml文件解析…

《扬帆优配》新增21亿订单,海风龙头获多路资金抢筹!

今天仅三个职业获主力资金净流入。 证券时报数据宝计算,今天沪深两市主力资金净流出295.18亿元,其间创业板净流出76.61亿元,沪深300成份股净流出92.15亿元。 申万一级职业中,今天传媒、电子、有色金属等6个职业上涨。25个跌落职业…

通达海深交所上市:市值51亿 2022年净利降8%

雷递网 雷建平 3月20日 南京通达海科技股份有限公司(简称:“通达海”,证券代码:301378)今日在深交所创业板上市。 通达海本次发行1150万股,发行价为95元,募集资金10.93亿元。 通达海开盘价为110…

通达海:一直推进人工智能在法院具体业务场景应用方面的研究

导读:通达海近期接受投资者调研时称,公司也一直在推进人工智能在法院具体业务场景应用方面的研究,包括立案风险预警、要素信息抓… 通达海近期接受投资者调研时称,公司也一直在推进人工智能在法院具体业务场景应用方面的研究&…

马斯克“翻车”现场:“甩”不掉的推特

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 自上周五宣布终止对推特的收购以来,马斯克再次成为科技网站的首页“常驻嘉宾”。 面对马斯克意欲违约并想把责任推得干干净净后,推特显然也不是“吃素的”:仍将致力…

用nltk模仿海子写中文现代诗

文章目录 前言开始编程寻找素材处理语料一些类似的步骤 运行结果 前言 仅仅写英文诗还不够,我们又把主意打到了中文诗头上。不过要写古体诗还有一些困难,我们先尝试一下现代诗。 写中文现代诗的代码与英文诗类似,区别主要在语料的处理上&am…

OpenAI的ChatGPT、微软的New Bing、百度的文心一言、Google的Bard、阿里云的通义千问

随着 ChatGPT 热潮卷起来,微软发布New Bing、百度发布了文心一言、Google 发布了 Bard,阿里云官方终于也宣布了,旗下的 AI 大模型“通义千问”也正式开启测试! ChatGPT ChatGPT是一种由OpenAI训练的大型语言模型。它的原理是基于…

ControlNet仅靠一张照片完成“旧房改造” | GitHub热榜第一

Alex 发自 凹非寺量子位 | 公众号 QbitAI 这是同一个房间改装前后的样子: 一下子质感Up,从凌乱过时变成了有腔有调的现代风。 至于设计费嘛,其实是…一分钱都没花! 因为这并不是专业设计师做的方案,而全靠一只AI完成。…

chatgpt赋能python:Python怎么抢优惠券?优惠不再是梦想!

Python怎么抢优惠券?优惠不再是梦想! 在如今的消费社会,优惠券已成为人们购物时追逐的目标。而优惠券的数量有限且抢手,往往仅能在短时间内领取,因此初次抢到心仪的优惠券可谓令人欣喜不已。而对于程序员们而言&#…

第十八届全国大学生智能汽车竞赛-竞速比赛完全模型组规则

01 完全模型组 一、比赛构成 百度完全模型竞速赛分为线上资格赛、线下分区赛和全国总决赛三个阶段,组委会将综合考虑线上资格赛和线下分区赛成绩来进行全国总决赛名额的选拔,其中线上成绩占10%,线下成绩占90%。组委会将从报名参加线上资格赛的…

国赛来咯!第十八届全国大学生智能汽车竞赛百度竞速赛正式开启

「第十八届全国大学生智能汽车竞赛—百度完全模型组竞速赛」将于1月7日(本周六19:00)全面启航!大赛组委会秘书长、清华大学卓晴教授届时将亲临百度飞桨B站直播间,和同学们一起聊备赛,话今年。 竞赛介绍 「全国大学生智…

【智能汽车竞赛】极速越野组参赛总结

目录 第一章 引 言 第二章 机械结构的调整与优化 2.1 主板和驱动板板的固定及连接 2.2 模型车机械部分安装及改造 2.2.1 优化车身强度 2.2.2 前轮定位 2.3 传感器的设计安装 2.3.1 ICM-20602 安装 2.3.2 gps 传感器的安装 第三章:硬件电路设计 3.1 主控板模块 3.…

史上最强模型 GPT-4 上线:一张手绘草图能生一个网站、60 秒搞定一个游戏开发!...

整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 平地一声雷,GPT-4 重磅来袭。 3 月 14 日,OpenAI 正式上线新一代人工智能大模型 GPT-4,它是一个大型多模态模型,可以接受图像和文本输入,同时…

【12亿】微信月活11.12亿,抖音年赚200亿?中国最受欢迎五大社交平台

在互联网行业,社交一直都是巨头们的兵家必争之地。从QQ到微信,从微博到抖音,新的社交平台在不断出现和崛起,用户也从90后延伸到了00后,而社交时代的风云变幻,也映射了互联网发展趋势以及网友社交方式的变化…

让OpenAI GPT3替我写数据竞赛代码!

★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>> 让OpenAI GPT3替我写数据竞赛代码! OpenAI与ChatGPT OpenAI是在美国成立的人工智能研究公司,核心宗旨在于实现安全的通用人工智能(AGI)。他们开发的ChatGP…

Github Copilot Chat申请,安装,及常见问题解决

文章目录 实际使用效果:申请使用常见问题 参考 Copilot Chat 是Copilot X 引入的预览功能,不但可以像Chatgpt一样聊天,也可以解释代码,bug 修复,也可以生成单元测试。是一个非常有吸引力的功能。 实际使用效果&#xf…

Android 科大讯飞 语音转文字

Android 科大讯飞 语音转文字 语音听写SDK适配安卓6.0需要手动申请权限,各位可以自信查询资料实现,关于语音听写SDK的开发,参考科大讯飞开放平台官网为准 第一,首先去科大讯飞官网注册一个账号:https://console.xfyun.cn/app/myap…

讯飞离线语音合成接入

讯飞离线语音合成接入: 文字转语音的方法 1.Google TextToSpeech 中文语音引擎 Google提供了原生的方法TextToSpeech,但是不支持中文,sad… 不过可以用第三方的语音引擎,eg,讯飞,百度… 详情参考&…