数据仓库【指标体系】

        指标体系是将零散单点的具有相互联系的指标,系统化的组织起来,通过单点看全局,通过全局解决单点的问题。它主要是由指标和体系两部分组成。

        指标是指将业务单元细化后量化的度量值,它使得业务目标可描述、可度量、可拆解,它是业务和数据的结合,是统计的基础,也是量化效果的重要依据。

指标相关基本概念

  • 业务板块:比数据域更高维度地业务划分方法,适用于庞大地业务系统;
  • 维度:维度建模由Kimball提出。维度模型主张从分析决策的需求触发构建模型,为分析需求服务。维度是度量的环境,是我们观察业务的角度,用来反应业务的一类属性。属性的集合构成维度,维度也可以称为实体对象。例如,在分析交易过程时,可以通过买家、卖家、商品和时间等维度描述交易发生的环境。
  • 属性(维度属性):维度所包含的表示维度的列称为维度属性。维度属性是查询约束条件、分组和报表标签生成的基本来源,是数据易用性的关键。
  • 度量:在维度建模中,将度量称为实时,将环境描述为维度,维度是用于分析事实所需要的多样环境。度量通常为数值型数据,作为事实逻辑表的事实。
  • 指标:指标分为原子指标和派生指标。原子指标是基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,是具有明确业务含义的名词,体现明确的业务统计口径和计算逻辑,例如支付金额。
  • 业务限定:统计的业务范围,筛选出符合业务规则的记录(类似于SQL中where 条件,非时间类)。
  • 统计周期:统计的事件范围,例如最近一天,最近30天等(类似SQL中的where后的时间条件)。
  • 统计粒度:统计分析的对象或视角,定义数据需要汇总的程度,可以理解为聚合运算时的分组条件(类似SQL中的Group by的对象)。粒度是维度的一个组合,指明统计范围。例如,某个指标是某个卖家在某个省份的成交额,则粒度就是卖家、地区这两个维度的组合。如果需要统计全表的数据,则粒度为全表。在指定粒度时,需要充分考虑到业务和维度的关系。统计粒度常作为派生指标的修饰词而存在。
  • 修饰词:计算指标的条件限制,如正常状态、盈利门店、亏损门店等。

为什么要搭建指标体系

  1. 衡量业务发展质量
  2. 建立指标因果关系
  3. 指导用户分析工作
  4. 指导基础数据建设
  5. 指导内容产品建设
  6. 统一指标消费口径

指标体系可以帮助我们整体理解业务全面了解问题快速定位问题迅速落地方案,我们说的指标体系不止是指标,还有指标管理和指标监控。 

指标体系分级建设

  1. 一级指标:公司战略层面指标用于衡量公司整体目标达成情况的指标,主要是决策指标,T1指标通常服务于公司战略决策层。比如公司的销售额,或者社交产品的活跃度;

  2.  二级指标:业务策略层面指标 为达成T1指标的目标,公司会对目标拆解到业务线或者事业群,并有针对性做出一系列运营策略,T2指标通常反应的是策略结果属于支持性指标同时也是业务线或事业群的核心指标。二级指标是一级指标的路径指标。一级指标发生变化的时候,我们通过查看二级指标,能够快速定位问题的原因所在。

  3. 三级指标:业务执行层面指标T3指标是对T2指标的拆解,用于定位T2指标的问题。T3指标通常也是业务过程中最多的指标。根据各职能部门目标不同,其关注的指标也各有差异。T3指标的使用通常可以指导一线运营或分析人员开展工作,内容偏过程性指标,可以快速引导一线人员做出相应的动作。

指标在数仓中的层级

  • 原子指标:dwd层(明细粒度指标数据),原子指标= 业务过程+度量

  • 派生指标:dws层(主题域宽表,不跨域),派生指标= 时间周期+修饰词+原子指标,派生指标可以理解为对原子指标业务统计范围的圈定。

  • 复合指标:ads层(应用层,跨主题,面向报告表输出),多个派生指标的叠加计算。 

业务指标体系建设

        指标体系的设计及划分主要分为两种,一种 是从数据仓库建设的角度进行指标体系设计;一种是从业务指标分解的角度进行指标体系设计。数据仓库指标体系建设:是技术角度如何将业务指标进行实现及分解的方法。主要从业务流程的分解入手,叠加原子指标、修饰词、时间维度等的定义,将指标分层划分,并进行管理。数仓指标体系建设由数据开发人员根据数据需求进行设计。业务指标体系建设:从业务使用的角度,从使用场景触发,识别对业务提升、运营效率提升的指标体系建设。业务指标体系由数据分析人员结合业务应用场景进行设计。

建设指标体系需要明确的几个问题

  • 愿景:提升业务效率、减少重复建设等
  • 有谁规划:数据分析师+业务人员负责需求
  • 给谁使用:数据分析师出报告、运营人员做运营、管理人员做决策
  • 由谁开发:大数据开发/数据仓库工程师
  • 如何呈现:数据可视化看板(BI工具+系统开发)

分析模型指标体系建设三大步骤

  1. 业务目标 :OSM模型

  2. 用户/产品生命周期及其行为路径:AARRR模型(产品)+UJM模型(用户)

  3. 指标分级下钻:MECE模型

数据指标体系建设的方法可以总结为三个步骤,即明确业务目标,根据用户/产品生命周期行为路径指定每个步骤的目标、策略及度量,最后对指标进行分级分类管理及细化。在这三个步骤当中又涉及到OSM+AARRR+UJM+MECE四个模型,这四个木星是指导我们构建完整而清洗的指标体系方法论。

1、总体原则:明确业务目标、制定策略、明确度量

 OSM模型:Object-Strategy-Measure的缩写

O-Object:代表目标。所以,我们在建立数据指标体系之前,一定要清洗的了解业务目标。

S-Strategy:策略,达成以上的业务目标,需要制定的行动策略

M-Measure:度量,为了衡量策略是否有效,就需要我们制定较细的评估指标,反应目标的达成情况。

2、具体方法:理清产品及用户声明周期路径

梳理产品的用户生命旅程,以校对业务目标,判断它能否与用户的每个阶段的旅程吻合。

  •  AARRR模型:是基于产品角度,简单的来说就是拉新、促活、留存、付费、推广;
“海盗法则”环节关注指标
用户获取(Acquisition)DNU、ROI、LTV、CPA、CPC等
用户激活(Activation)DAU、MAU、PV、UV、浏览时长等
用户留存(Retention)第i日留存、DAU/MAU、流失率
获取收入(Revenue)GMV、ARPU、ARPPU、转化率
推荐传播(Referral)邀请发送量、k-因子、病毒传播周期
  • UJM模型:User-Journey-Map模型。是基于用户角度触发,描述了用户进入产品的整个路径流程,即注册、登录、浏览、加购、购买、复购流程。
    • 用户行为:用户在该旅途会进行什么操作
    • 目标:在该旅途要完成的目标
    • 接触点:产品与用户连接的地方
    • 问题点:当前在该旅途会有什么困难或者不足
    • 机会点:针对目标、行为和问题点总结出机会点
    • 衡量指标:针对机会点选择合适的指标进行度量

3、分级细化:指标体系分级建设

              只便于业务理解的逻辑划分,不再物理存储层面产生作用。前面两个步骤,首先我们明确了解业务核心目标、策略及方法,接下来我们需要向下进行逐层拆解,这个过程我们称为指标体系分级治理,用到的模型是MECE(Mutually Exclusive Collectively Exhaustive)模型,完全独立,互相穷尽。好处是可以对指标逐层细化,针对各个层级查漏补缺,二是便于后续指标的运营维护及管理。

  • 一级指标:全公司都认可的、衡量业绩的核心指标。
  • 二级指标:二级指标是一级指标的路径指标。一级指标发生变化的时候, 我们可以通过查看二级指标,能够快速定位问题的原因所在。
  • 三级指标:三级指标是对二级指标的路径的分析。通过三级指标,可以高效定位二级指标波动的原因。

 完整的指标体系搭建流程总结为七个步骤:

  1. 需求调研:产品或者运营完成产品原型或者运营方案,数据分析师根据原型或者运营方案提炼数据需求,评估需求可行性并和需求方讨论修改不合理的需求。
  2. 需求分析:数据分析师将数据需求整理成文档并根据优先级对需求进行排期;
  3. 确定指标体系方案:数据分析师以OSM、AARRR、UJM、MECE模型作为指导思想,确定指标体系建设方案;
  4. 数据采集:数据分析师根据初步的指标体系建设方案明确要采集的数据源,设计数据采集方案,如系统中当前没有需要的数据,则需要设计埋点方案,同时给出字段命名规范一级数据采集方案,开发根据需要在对应的系统进行埋点;
  5. 数据开发:大数据开发工程师根据底层的数据需求,进行数据仓库设计,同时将数据接入到数仓;
  6. 指标发布及优化:针对开发好的指标进行校验,同时建设可视化的图标方案,通过效果使用迭代指标体系;
  7. 效果评估:指标体系落地,用于监控业务现状,指导业务决策,定位业务问题,在业务的不断反馈中逐渐完善整套指标体系。

 场景化搭建指标体系

通过抽象场景”人、货、场“,实际就是我们日常所说的用户、产品、场景,通俗点讲就是谁在什么场景下用了什么产品,不同的商业模式会有不同的组合模式。

        ”人“的视角,我们比较关心的是什么乘客在什么时间打车,排队多长时间,等了多长时间上车,周期内第几次打车,打车花了多少钱,是否有投诉行为和取消行为,具体到数据指标主要看发单用户数、完单用户数、客单价、周期内完单订单数、取消订单数、评价订单数等。

 ​​​”货“的视角,我们比较关心的就是成交了多少,成交额多少,花了多少,到具体数据指标会看GMV、成交率、取消率指标,进一步细分到城市、区域,一级品类、二级品类。数据的效果通过目标对比、横向对比、历史比较等方式进行分析确定。

 

”场“的视角,我们比较关心的就是哪些渠道用户点击量大曝光率大,带来了多少新用户,完成多少交易订单,客单价是多少,或者哪些活动拉新货促销 效果怎么样转化率多少,结合场景数据实际情况制定对应的策略。

 

以上分别从人、货、场三个角度进行了数据指标的分析维度的提炼,下面我们把这三类指标分级的方法分解关联。

 

指标体系评价

 

  1. 系统性:能够发现局部与整体的关系及问题定位,当数据发生异动时,通过指标体系的逻辑拆解,能够迅速定位到大致移动模块及原因;
  2. 全面性:能满足不同数据使用方的日常需求,对产品经营及发展情况有整体的了解;
  3. 认知统一:指标体系服务于不同角色群体,简单科学可解释,符合大众认知,大家都共同认可;
  4. 真实性:指标体系要能反应产品真实情况,杜绝华而不实的虚荣指标;
  5. 可迭代:指标体系随不同生命周期阶段而改变,指标体系要在发展中保持迭代;
  6. 可操作:如果能从时间向对比、或者从其他维度比如用户群体、产品、地域等不同维度进行横向比较,可以更好的观察业务的发展趋势,定位问题、找到原因,以及改善业务中需要改善的环节。 

指标管理

        指标作为业务和数据的结合,它基础是数据统计,指标也是量化业务效果的依据。既然和业务挂钩那就会又说不清楚的变化,其实这也是我们做指标管理的主要原因,业务在快速发展,所以在这个过程中的口径和逻辑都在发生变化,如果不统一进行管理和维护的话会出现指标口径模糊逻辑不清。

  • 业务视角
    • 业务分析场景指标、维度不明确
    • 频繁的需求变更和反复迭代,数据报表臃肿,数据参差不齐
    • 用户分析具体业务问题找数据、核对确认数据成本较高
  • 技术视角
    • 指标定义,指标命名混乱,指标不唯一,指标维护口径不一致
    • 指标生产,重复建设;数据会算成本较高
    • 指标消费,数据出口不统一,重复输出,输出口径不一致
  • 产品视角 
    • 缺少系统产品化支持从生产到消费数据流没有系统产品层面打通。

指标字典

指标字典,其实就是对指标的管理,指标多了以后,为了共享和统一修改和维护,我们会在Excel中维护所有的指标。

  • 指标编码:为了方便查找和管理,我们会对指标定义一套编码
  • 业务口径:指标最重要的就是明确指标的统计口径,就是这个指标是怎么算出来的,口径统一了,才不会产生歧义;
  • 梳理口径:一开始梳理是比较麻烦的,因为要统一一个口i纪念馆,需要和不同的部门去沟通协调;出现新的指标的时候,需要判断是否需要,是否可以用其他指标来替代,指标与指标之间的关系也要理清楚。
  • 迭代维护:第一版指标梳理好之后,需要进行推广和维护,不断地迭代,持续推动,让公司所有部门都统一站在一个视角上关注问题;
  • 计算公式:对业务口径地翻译,需要业务方告知你从哪里地数据去计算 。

指标模板

  1. 数据域 :指面向业务分析,将业务过程或者维度进行抽象地集合。其中,业务过程可以概括为一个不可拆分地行为事件,在业务过程之下,可以定义指标;维度,是度量地环境。为了保障整个系统地生命力,数据域是需要抽象提炼,并且长期维护更新地,变动需要执行变更流程;

  2. 业务过程:指公司地业务活动事件,如,订单、支付都是业务过程。其中,业务过程不可拆分

  3. 时间周期:用来明确统计地时间范围或时间点,如最近30天、自然周、截至当日等

  4. 修饰类型:对修饰词地一种抽象划分。修饰词类型从属于某个业务域,如日志域地访问终端类型涵盖APP端、PC端等修饰词;

  5. 修饰词:指的是统计维度以外指标地业务场景限定抽象,修饰词属于一种修饰类型,如日志域方位终端类型下,有修饰词APP、Pc等

  6. 度量/原子指标:原子指标和度量含义相同,基于某一个业务事件行为下地度量,是业务定义中不可再拆分地指标,具有明确业务含义的名称,如支付金额;

  7. 维度:维度是度量的环境,用来反应业务的一类属性,这类属性的集合构成一个维度,也可以称为实体对象。维度属于一个数据域,如地理维度(其中包括国家、地区、省市等)、时间维度(其中包括年、季度、月、周、日等级别内容)

  8. 维度属性:维度属性是隶属于一个维度,如地理维度里面的国家名称、国家ID、省份名称都属于维度属性

  9. 指标分类

    1. 原子指标:基于某一业务事件行为下的度量,是业务定义中不可拆分的指标,具有明确业务含义的名称,如交易金额;

    2. 派生指标:一个原子指标+多个修饰词+时间周期,是原子指标业务统计范围的圈定。派生指标又分为两个类型:

      1. 事务型指标:指对业务过程进行衡量的指标。例如,订单支付金额,这类指标需要维护原子指标及修饰词,在此基础上创建派生指标

      2. 存量型指标:是指对实体对象某些状态的统计,例如注册司机总数、注册乘客总数,这类指标需要维护原子指标以及修饰词,在此基础上创建派生指标,对应的事件周期一般为“历史截至当前某个时间”

    3. 衍生指标:是指事务型指标和存量指标的基础上符合成的,主要有比率型、比例型、统计型均值

指标管理系统

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/262135.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聊一聊EGO-Planner膨胀系数的大小对无人机避障飞行的影响

EGO-Planner简介 EGO-Planner作为业界知名的无人机轨迹规划算法,其优势在于能够在复杂环境中快速规划出安全、平滑且动态可行的飞行轨迹。在这个算法中,膨胀系数发挥着关键作用。它通过扩大障碍物的感知范围,提供额外的安全边距,…

1、WEB攻防-通用漏洞SQL注入MYSQL跨库ACCESS偏移

用途:个人学习笔记,欢迎指正! 前言: 为了网站和数据库的安全性,MYSQL 内置有 ROOT 最高用户,划分等级,每个用户对应管理一个数据库,这样保证无不关联,从而不会影响到其他…

关于使用Mxnet GPU版本运行DeepAR报错解决方案

1.引言 我们经常使用GPU来训练和部署神经网络,因为与CPU相比,它提供了更多的计算能力。在本教程中,我们将介绍如何将GPU与MXNet GluonTS一起使用。 首先,确保您的机器中至少有一个Nvidia GPU,并正确安装了CUDA以及CUDN…

CrossOver虚拟机软件2024有哪些功能?最新版本支持哪些游戏?

CrossOver由codewaver公司开发的类虚拟机软件,目的是使linux和Mac OS X操作系统和window系统兼容。CrossOver不像Parallels或VMware的模拟器,而是实实在在Mac OS X系统上运行的一个软件。CrossOvers能够直接在Mac上运行Windows软件与游戏,而不…

Spring篇----第二篇

系列文章目录 文章目录 系列文章目录前言一、Spring Framework 中有多少个模块,它们分别是什么?二、什么是 Spring 配置文件?三、Spring 应用程序有哪些不同组件?前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站…

Linux编译器---gcc/g++使用详解

目录 前言 gcc/g介绍 gcc/g的编译指令(以gcc为例) ​编辑 gcc选项 预处理(进行宏替换) 编译(生成汇编) 汇编(生成机器可识别代码) 链接(生成可执行文件或库文件) 函数库 概念 …

基于SSH打通隧道实现异地组网

前言 最近有异地组网的需求,我目前的是用蒲公英X1盒子来进行组网,但是蒲公英X1非会员账号有设备限制3个(这个是硬伤),虽然说可以打通P2P但是在复杂的网络环境下概率不是特别高 所以研究下SSH异地组网的方式&#xff…

超级实用的python代码片段汇总和详细解析(16个)

目录 1. 生成随机文本 2. 计算文本文件中的字数 3. 替换文件文件中的字串 4. 多文件名的批量替换 5. 从网站提取数据 6. 批量下载图片 7.批量删除空文件夹 8.Excel表格读写 9.合并Excel表格工作簿 10.数据库SQL查询 11. 系统进程查杀 12.图像尺寸调整和裁剪 13.图…

【Java EE初阶二十】http的简单理解(一)

1. 初识http HTTP 最新的版本应该是 HTTP/3.0,目前大规模使用的版本 HTTP/1.1; 下面来简单说明一下使用 HTTP 协议的场景: 1、浏览器打开网站 (基本上) 2、手机 APP 访问对应的服务器 (大概率) 前面的 TCP与UDP 和http不同,HTTP 的报文格式&a…

信钰证券:A股逼空七连阳后何去何从?3000点会不会成为新起点

沪指豪取七连阳,创三年半以来最长连涨纪录。 A股三大股指2月22日开盘涨跌互现。早盘指数分解,沪强深弱格局再现,创指始终保持颓势。午后指数继续分解,但尾盘三大股指携手上涨。 关于此轮上涨,方正证券剖析师赵伟强调…

【开源】SpringBoot框架开发音乐平台

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块三、系统展示 四、核心代码4.1 查询单首音乐4.2 新增音乐4.3 新增音乐订单4.4 查询音乐订单4.5 新增音乐收藏 五、免责说明 一、摘要 1.1 项目介绍 基于微信小程序JAVAVueSpringBootMySQL的音乐平台,包含了音乐…

Shopee加载图片很慢怎么办?Shopee图片优化的重要性?站斧浏览器

Shopee加载图片很慢怎么办? 加载图片过慢不仅影响用户体验,还可能导致顾客流失。以下是一些解决策略: 优化图片大小:在保证图片质量的前提下,尽量减小图片的文件大小。这可以通过调整图片尺寸、压缩图片质量或使用适…

EI级 | Matlab实现TCN-GRU-MATT、TCN-GRU、TCN、GRU多变量时间序列预测对比

EI级 | Matlab实现TCN-GRU-MATT、TCN-GRU、TCN、GRU多变量时间序列预测对比 目录 EI级 | Matlab实现TCN-GRU-MATT、TCN-GRU、TCN、GRU多变量时间序列预测对比预测效果基本介绍程序设计参考资料 预测效果 基本介绍 【EI级】Matlab实现TCN-GRU-MATT、TCN-GRU、TCN、GRU多变量时间…

Redis突现拒绝连接问题处理总结

一、问题回顾 项目突然报异常 [INFO] 2024-02-20 10:09:43.116 i.l.core.protocol.ConnectionWatchdog [171]: Reconnecting, last destination was 192.168.0.231:6379 [WARN] 2024-02-20 10:09:43.120 i.l.core.protocol.ConnectionWatchdog [151]: Cannot reconnect…

层级关联,审批人功能

一个需求要求选择一级&#xff0c;下方展示一级的效果 后端给了审批人数据&#xff0c;但是数据需要单独处理 <template><div class"box"><el-form :model"ruleForm" :rules"rules" ref"ruleForm" label-width"…

基于java+springboot+vue实现的美食信息推荐系统(文末源码+Lw)23-170

1 摘 要 使用旧方法对美食信息推荐系统的信息进行系统化管理已经不再让人们信赖了&#xff0c;把现在的网络信息技术运用在美食信息推荐系统的管理上面可以解决许多信息管理上面的难题&#xff0c;比如处理数据时间很长&#xff0c;数据存在错误不能及时纠正等问题。这次开发…

mapbox面图层标注

mapbox并没有一个属性类似于’text-field’的symbol图层的直接可以标注的办法&#xff0c;这里笔者提供两种其他的面图层标注的办法用来大家参考 贴个群号 WebGIS学习交流群461555818&#xff0c;欢迎大家。 效果图 方案一 把面图层当做点图层直接展示 在mapbox里面&#x…

Django后端开发——ORM

文章目录 参考资料ORM-基础字段及选项字段类型练习——添加模型类应用bookstore下的models.py数据库迁移——同步至mysqlmysql中查看效果字段选项Meta类定义示例:改表名应用bookstore下的models.py终端效果练习——改表名+字段选项修改应用bookstore下的models.py终端效果ORM基…

超市售货|超市售货管理小程序|基于微信小程序的超市售货管理系统设计与实现(源码+数据库+文档)

超市售货管理小程序目录 目录 基于微信小程序的超市售货管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、微信小程序前台 2、管理员后台 &#xff08;1&#xff09;商品管理 &#xff08;2&#xff09;出入库管理 &#xff08;3&#xff09;公告管理 …

研发流程图

1、需求评审流程 2、用例评审流程 3、代码评审流程 4、产品功能上线流程