数据分析因子评分学习

当多个因素影响一个结果时,我们需要综合考虑这些因素分别对结果德影响。因子评分就是用于比较其对结果德影响程度。

文章目录

  • 前言
  • 一、案例背景
  • 二、解决方案
    • (一)分析思路
    • (二)剔除无关数据
    • (三)求变化值
    • (四)求收入评分
      • 1. 数据标准化
      • 2. 缩放
      • 3. 倒数
    • (五)求费用评分
    • (六)计算综合评分
  • 总结


前言

数据分析师的日常工作中,经常会遇到这样的问题,分析某个指标的下降/上升原因,且这个指标并不是受单一因素影响,这时就要求我们综合考虑分析。本文分享数据分析因子评分的学习案例,供各位小伙伴参考。
案例来源:【分析方法】指标下降如何分析?分享一种“因子评分法”,帮你快速定位原因​​,案例中数据标准化公式可能为原作者笔误,本人做部分修改。


一、案例背景

如下图所示,某新兴打车软件公司,2018年7月渠道引流新用户ROI环比大幅下降,需要排查异常渠道,为业务指明方向。
在这里插入图片描述
名词释义:
投资回报率(ROI)=(税前年利润/投资总额)*100%。是指企业从一项投资性商业活动的投资中得到的经济回报,是衡量一个企业盈利状况所使用的比率,也是衡量一个企业经营成果和效率的一项综合性指标。本案例ROI=收入/费用

二、解决方案

(一)分析思路

由于ROI受收入和费用两个因子影响,单看各渠道ROI无法准确定位到重点异常渠道。可使用因子评分,综合结果得到结论。

(二)剔除无关数据

虽然整体ROI下降近25%,但快手渠道的ROI却上升,分析下降原因时,应先将其剔除。
在这里插入图片描述

(三)求变化值

将剩余4各渠道的收入和费用进行差值计算,由于ROI=收入/费用,当收入和费用同时增加时,两者对ROI贡献的影响程度相反。求出“收入变化-费用变化”值,用于判断各渠道对ROI下降的影响。
在这里插入图片描述

(四)求收入评分

1. 数据标准化

这里使用其中一种计算方式(极差标准化法),将最大值定为1,最小值定为0,把所有值到压缩到0和1之间,常用于统一数据量级。计算公式为:(x-x最小值)/(x最大值-x最小值),如该案例中,抖音的收入变化计算过程为:(-12540-(-21347))/(720-(-21347))=0.399102733

2. 缩放

在ROI的的计算中,收入作为分子,分子下降越多,ROI值则下降越多,需要将其进行缩放倒数
缩放到0.1~0.9之间,计算公式为:(0.9-0.1)*x+0.1,如该案例中,抖音的缩放计算过程为:(0.9-0.1)*0.399102733+0.1=0.419282186

3. 倒数

倒数,使其与评分正相关(“收入变化”越大,评分越高),计算公式为:1/x
在这里插入图片描述

(五)求费用评分

在ROI的计算中,费用作为分母,“费用变化”越大,评分越高。所以不必进行缩放倒数,直接标准化。
在这里插入图片描述

(六)计算综合评分

将收入评分与费用评分相加,可以看出,对ROI大幅下降的影响程度:抖音>今日头条>百度>爱奇艺。
在这里插入图片描述


总结

以上案例的因子评分,其实分别分析收入和费用两个因子的变化情况,最后综合考虑才得出结论。假设不综合考虑,如下图所示:

  1. 如果单纯看ROI环比,变化幅度是:抖音>百度>今日头条>爱奇艺;
  2. 如果单纯看收入变化,影响程度是:今日头条>抖音>百度>爱奇艺;
  3. 如果单纯看费用变化,影响程度是:抖音>百度>爱奇艺,今日头条费用减少,不会导致ROI下降

从单一角度考虑,都无法得出较准确的结论。所有可以参考上文,从以下几步分析:

  1. 剔除无关数据
  2. 求变化值
  3. 利用数据标准化,求各因子评分(评分旨在达到评分项变化越大,分数越高的效果
  4. 综合评分得出结论
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/123943.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

核心实验11合集_hybrid接口特殊用法_ENSP

项目场景一: 核心实验11合集_hybrid接口特殊用法_ENSP 前期用户少,只有一个vlan段,如今需要划分不同vlan,使用hybrid接口实现。(不可更改ip地址) 实搭拓扑图: 具体操作: sw1: [sw1…

Linux--VMware的安装和Centos

一、VMware和Linux的关系 二、VMware的安装 VM_ware桌面虚拟机 最新中文版 软件下载 (weizhen66.cn) VMware-Workstation-Lite-16.2.2-19200509-精简安装注册版.7z - 蓝奏云 如果安装不成功,则设置BIOS 三、在VMware中加入Centos 下载地址: CentOS-…

【1++的数据结构】之哈希(一)

👍作者主页:进击的1 🤩 专栏链接:【1的数据结构】 文章目录 一,什么是哈希?二,哈希冲突哈希函数哈希冲突解决 unordered_map与unordered_set 一,什么是哈希? 首先我们要…

[E2E Test] Python Behave Selenium 一文学会自动化测试

前言 本文将使用Python Behave与Selenium,和同学们一起认识自动化测试,并附上完整的实践教程。 项目源码已上传:CSDN 郭麻花 Azure Repo python-behave-selenium 核心概念 1. 什么是E2E Test E2E即End-to-end,意思是从头到尾…

Java ArrayList

简介 ArrayList类示一个可以动态修改的数组,与普通数组的区别是它没有固定大小的限制,可以添加和删除元素。 适用情况: 频繁的访问列表中的某一元素只需要在列表末尾进行添加和删除某些元素 实例 ArrayList 是一个数组队列,提…

外滩大会今日开幕 近20位“两院”院士、诺贝尔奖和图灵奖得主齐聚

2023 Inclusion外滩大会9月7日在上海黄浦世博园正式开幕。这场以“科技创造可持续未来”为主题的大会为期三天,近20位“两院”院士、诺贝尔奖和图灵奖得主,全球超500位有影响力的科技领军企业和专家学者,将在此带来一场科技、人文和产业的思想…

深度学习之视频分类项目小记

写在前面,最近一阵在做视频分类相关的工作,趁有时间来记录一下。本文更注重项目实战与落地,而非重点探讨多模/视频模型结构的魔改 零、背景 目标:通过多模态内容理解技术,构建视频层级分类体系原技术方案&#xff1a…

09-JVM垃圾收集底层算法实现

上一篇:08-JVM垃圾收集器详解 1.三色标记 在并发标记的过程中,因为标记期间应用线程还在继续跑,对象间的引用可能发生变化,多标和漏标的情况就有可能发生。 这里我们引入“三色标记”来给大家解释下,把Gcroots可达性…

golang 通用的 grpc http 基础开发框架

go-moda golang 通用的 grpc http 基础开发框架仓库地址: https://github.com/webws/go-moda仓库一直在更新,欢迎大家吐槽和指点 特性 transport: 集成 http(echo、gin)和 grpc。tracing: openTelemetry 实现微务链路追踪pprof: 分析性能config: 通用…

【云计算网络安全】解析DDoS攻击:工作原理、识别和防御策略 | 文末送书

文章目录 一、前言二、什么是 DDoS 攻击?三、DDoS 攻击的工作原理四、如何识别 DDoS 攻击五、常见的 DDoS 攻击有哪几类?5.1 应用程序层攻击5.1.1 攻击目标5.1.2 应用程序层攻击示例5.1.3 HTTP 洪水 5.2 协议攻击5.2.1 攻击目标5.2.2 协议攻击示例5.2.3 …

IDEA集成Apipost Helper实现一键部署接口(避免参数注释)

先说好处: 1.一次性导入所有接口,不要一个一个扒。 2.对于字段的注释不要一个一个的去手写,映射实体类,自己上传(最重要)。 3.目录自动归类划分,避免接口混乱。 安装插件 首先,我们打…

Apache nginx解析漏洞复现

文章目录 空字节漏洞安装环境漏洞复现 背锅解析漏洞安装环境漏洞复现 空字节漏洞 安装环境 将nginx解压后放到c盘根目录下: 运行startup.bat启动环境: 在HTML文件夹下有它的主页文件: 漏洞复现 nginx在遇到后缀名有php的文件时,…

基于springboot实现了后台定时统计数据报表并将数据生成excel文件作为附件,然后通过邮件发送通知的功能

概述 本例子基于springboot实现了后台定时统计数据报表并将数据生成excel文件作为附件,然后通过邮件发送通知的功能。 详细 一、准备工作 1、首先注册两个邮箱,一个发送邮箱,一个接收邮箱。 2、发送邮箱开启IMAP/SMTP/POP3服务&#xff0c…

【嵌入式开发 Linux 常用命令系列 7.1 -- awk 过滤列中含有特定字符的行】

文章目录 awk 过滤列中字符串 上篇文章:嵌入式开发 Linux 常用命令系列 7 – awk 常用方法详细介绍 awk 过滤列中字符串 cat test.log | awk -F $31 {print $0}说明: -F 以什么分隔列,这里是以空格为分隔符;$3代表第3列;$3…

2023 年全国大学生数学建模B题目-多波束测线问题

B题目感觉属于平面几何和立体几何的问题,本质上需要推导几何变换情况,B题目属于有标准答案型,没太大的把握不建议选择,可发挥型不大。 第一问 比较简单,就一个2维平面的问题,但有点没理解,这个…

学习笔记——Java入门第二季

1.1 介绍类与对象 类和对象的关系: 时间万物皆对象。对象是具体的事物,是类的具体事例 类是抽象的概念,是对象的模板。 new关键字是创建实例对象最重要的标志 Dog duoduonew Dog(); Dog luckynew Dog(); 这样就创建了两个对象并且在java内…

尚硅谷大数据项目《在线教育之离线数仓》笔记007

视频地址:尚硅谷大数据项目《在线教育之离线数仓》_哔哩哔哩_bilibili 目录 第12章 报表数据导出 P112 01、创建数据表 02、修改datax的jar包 03、ads_traffic_stats_by_source.json文件 P113 P114 P115 P116 P117 P118 P119 P120 P121 P122【122_在…

LeetCode每日一题:1123. 最深叶节点的最近公共祖先(2023.9.6 C++)

目录 1123. 最深叶节点的最近公共祖先 题目描述: 实现代码与解析: dfs 原理思路: 1123. 最深叶节点的最近公共祖先 题目描述: 给你一个有根节点 root 的二叉树,返回它 最深的叶节点的最近公共祖先 。 回想一下&…

钉钉消息已读、未读咋实现的嘞?

前言 一款app,消息页面有:钱包通知、最近访客等各种通知类别,每个类别可能有新的通知消息,实现已读、未读功能,包括多少个未读,这个是怎么实现的呢?比如用户A访问了用户B的主页,难道…

文字转语音TTS bark SpeechT5 mms

bark GitHub - suno-ai/bark: 🔊 Text-Prompted Generative Audio Model microsoft SpeechT5 https://github.com/microsoft/SpeechT5 使用 SpeechT5 进行语音合成、识别和更多功能 - 掘金 Facebook mms https://github.com/facebookresearch/fairseq/tree/mai…