十年数据分析经验分享

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

在过去的十年里,作者在多个公司担任分析角色,从德国的小型金融科技初创公司到高增长的预IPO企业(如Rippling)和大型科技公司(如Uber和Meta)。每家公司都有其独特的数据文化,每个职位都有其挑战和经验。以下是作者过去十年里积累的十大关键经验,这些经验在不同公司阶段、产品或商业模式下都适用:

  1. 用数据讲故事
    想想你的受众是谁。如果在研究型组织工作,或主要向技术利益相关者(如工程团队)展示,学术风格的分析可能是合适的。但如果受众是非技术业务团队或高管,则需重点关注关键见解,而不是技术细节,并将工作与所影响的业务决策联系起来。沟通不是分享自己觉得有趣的内容,而是分享受众需要听到的内容。最知名的这种洞察导向、由上而下的沟通方法是由麦肯锡顾问Barbara Minto开发的金字塔原理。
  2. 商业敏锐度是优秀与卓越数据科学家的最大区别
    在一家要求很高的公司,如果你是高级数据科学家,可以预期所有同事都具备很强的技术能力。你不会通过逐步改进技术技能脱颖而出,而是通过确保你的工作为利益相关者(如产品、工程、业务团队)带来最大影响力。商业敏锐度在此发挥作用:为了最大化影响力,你需要深入了解业务的优先事项和利益相关者面临的问题,制定直接帮助这些优先事项的分析解决方案,并以受众理解的方式传达见解和建议。
  3. 做一个客观的真理追寻者
    许多人会选择性地挑选数据以适应他们的叙述。这是有道理的:大多数组织奖励人们实现目标,而不是最客观的表现。作为数据科学家,有奢侈的条件推翻这种做法。数据科学团队通常不直接掌握业务指标,因此比销售等团队面临的短期目标压力小。利益相关者有时会迫使你找到支持他们预先创建的叙述的数据。虽然迎合这种做法在短期内可能会赢得一些分数,但从长远来看,坚持真理的态度会使你脱颖而出,并成为高管们在需要无过滤和无偏见观点时的首选对象。
  4. 数据与初级研究的结合
    数据人员通常对“轶事证据”不屑一顾,但它是严格定量分析的必要补充。进行实验和分析大数据集可以提供统计上显著的见解,但往往会错过一些信号。深入研究关闭交易的笔记、与客户交谈、阅读支持票据等有时是揭示某些问题或真正理解根本原因的唯一途径。例如,在B2B SaaS业务中,可能会在数据中看到企业交易的获胜率下降,甚至可以缩小到某种类型的客户。但要真正理解发生了什么,必须与销售代表交谈,深入研究他们的交易笔记,甚至与潜在客户交谈。
  5. 如果数据看起来好得令人难以置信,那通常是有问题的
    当人们看到指标急剧上升时,他们往往会兴奋,并将这一变化归因于自己做的某件事。不幸的是,当指标变化看起来异常积极时,往往是因为数据问题或一次性影响。例如,最近时期的数据不完整,指标会在所有数据点进入后平稳下来;或者一次性顺风不会持续(如1月初销售激增,这只是节假日积压的订单清理)。需要保持怀疑态度、好奇心和经验,以避免陷阱并生成可靠的见解。
  6. 愿意改变主意
    如果你从事数据工作,经常改变观点是很自然的。例如,你向高管推荐了一个行动方案,但在获得更多数据后失去了对其的信心;或者你以某种方式解释了指标变化,但进行了额外分析后认为另有原因。然而,大多数分析人员由于害怕看起来不称职或惹恼利益相关者,往往不愿意收回过去的声明。尽管这可以理解,但不应仅仅因为害怕失面子而坚持先前的建议。
  7. 务实
    在分析领域工作时,很容易形成完美主义。尽管科学方法训练了我们理想的分析或实验方法,但商业现实常常带来严重的限制。作为数据人员,需要帮助业务团队完成任务,而不是坚持完美的方法。与其追求完美,不如优先完成任务。
  8. 避免数据科学家因临时请求而精疲力竭
    雇用全能数据科学家来主要构建仪表板或执行临时数据提取和调查是一条通向精疲力竭和团队流失的捷径。许多公司,尤其是高增长初创公司,不愿意专门雇用数据分析师或BI人员进行指标调查和仪表板构建,因为他们希望团队具备灵活性。然而,这种做法往往导致数据科学家花费大量时间在这些任务上,从而难以在大型战略项目上取得进展。
  9. 并非所有情况都需要复杂的仪表板
    公司往往认为从电子表格转向BI解决方案是成熟强大的数据文化的标志。尽管关键决策的仪表板应该放在受管控的BI工具中,但许多情况下,Google Sheets能更快速地提供所需结果。团队总会利用日常使用的软件(如Salesforce)和电子表格的分析功能,因为他们需要快速行动。鼓励这种灵活的、分散的分析方法,而不是强制所有分析都通过BI工具进行,可以节省数据科学团队的资源,并为团队提供成功所需的工具(如基本SQL培训、数据建模和可视化最佳实践)。
  10. 实现全公司范围内的指标标准化是不现实的
    在快速增长的初创公司中,强制执行完美的治理是不可能的。尽管数据科学家对不匹配的指标定义感到困扰,但实际上这并不是世界末日。只要关键报告得到严格处理并遵循标准化定义,公司的数据稍微混乱是可以接受的。团队总会通过在BI工具外进行黑客式分析来解锁自己,从而难以强制执行共享数据模型。

这些经验将帮助数据科学家在分析领域脱颖而出,成为真正的思维伙伴。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/342821.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WPF入门--多种方式设置样式(Style)

前言 在上篇文章中,介绍了WPF九种布局方式。本篇文章通过多种方式设置样式(Style)以控制UI元素的外观和行为。下面来具体介绍一下。 传送门 WPF入门--常用布局方式 目录 前言 一、直接在XAML中设置属性(内联样式&#xff09…

【蓝桥杯2025备赛】分巧克力

【蓝桥杯2025备赛】分巧克力 [蓝桥杯 2017 省 AB] 分巧克力 题目描述 儿童节那天有 K K K 位小朋友到小明家做客。小明拿出了珍藏的巧克力招待小朋友们。 小明一共有 N N N 块巧克力,其中第 i i i 块是 H i W i H_i \times W_i Hi​Wi​ 的方格组成的长方形…

C++ | Leetcode C++题解之第135题分发糖果

题目&#xff1a; 题解&#xff1a; class Solution { public:int candy(vector<int>& ratings) {int n ratings.size();int ret 1;int inc 1, dec 0, pre 1;for (int i 1; i < n; i) {if (ratings[i] > ratings[i - 1]) {dec 0;pre ratings[i] rati…

c++ 里函数选择的优先级:普通函数、模板函数、万能引用,编译器选择哪个执行呢?

看大师写的代码时&#xff0c;除了在类里定义了 copy 构造函数&#xff0c;移动构造函数&#xff0c;还定义了对形参采取万能引用的构造函数&#xff0c;因此有个疑问&#xff0c;这时候的构造函数优先级是什么样的呢&#xff1f;简化逻辑测试一下&#xff0c;如下图&#xff0…

计算机网络 —— 数据链路层(以太网)

计算机网络 —— 数据链路层&#xff08;以太网&#xff09; 什么是以太网以太网传输介质和拓扑结构的发展传输介质的发展&#xff1a;拓扑结构的发展&#xff1a; 10BASE-T 以太网适配器和MAC地址适配器&#xff08;Adapter&#xff09;MAC地址适配器与MAC地址的关系 MAC帧以太…

GLM-4-9B领先!伯克利函数调用榜单BFCL的Function Calling评测方法解析与梳理

智谱公布的GLM-4-9B基于BFCL榜单的工具调用能力测试结果 ©作者|格林 来源|神州问学 在智谱最新开源的GLM-4-9B-Chat中&#xff0c;其工具调用能力在BFCL&#xff08;伯克利函数调用排行榜&#xff09;榜上获得了超高的总BFCL分&#xff0c;和gpt-4-turbo-2024-04-09几乎不…

举个栗子!Quick BI 技巧(8):柱形图的制作及应用

众所周知&#xff0c;在数据分析中&#xff0c;柱形图是利用率非常高的一种图&#xff0c;主要是用于比较各组数据之间的差别&#xff0c;并且可以显示一段时间内的数据变化情况。那么在 Quick BI 中要如何来制作柱形图呢&#xff1f; 今天的栗子&#xff0c;我们就来分享如何…

网关鉴权模块-鉴权+登录拦截+jwt

1. 鉴权流程 浏览器发送请求时。请求头会携带键值对"authorization"&#xff1a;jwt 网关先解析jwt令牌&#xff0c;做第一次鉴权&#xff0c;鉴权完成后将解析的user对象的id添加到请求头中&#xff1a;user-info 用户id&#xff1b; 微服务的拦截器会获取请求头中…

spring boot2.7.x遇到问题

validation报错 高版本已移除了validation以来&#xff0c;需手动添加 <dependency><groupId>jakarta.validation</groupId><artifactId>jakarta.validation-api</artifactId> </dependency>mybatis报错 升级版本 <dependency>&…

基础篇01——SQL的基本语法和分类

MySQL数据库安装与基本使用 安装教程参见&#xff1a;通过zip安装MySQL 通过命令行启动和停止MySQL服务命令 前提&#xff1a;安装MySQL成功之后 启动服务&#xff1a;net start mysql 停止服务&#xff1a;net stop mysql 通过命令行连接mysql 可以通过mysql的客户端命令行…

记录某书请求返回406及响应{“code“:-1,“success“:false}

今天测试某个平台的爬虫时使用requests post请求正常写了个测试脚本把各种参数带上出来以后出现了406情况&#xff0c;和网站数据是完全一样的 以为是 X-S、X-T参接不对&#xff0c;但在postman里测试又是可以的成功&#xff0c;以为是检验了参数顺序&#xff0c;测试发现也没…

SQLAlchemy 模型中数据的错误表示

1. 问题背景 在使用 SQLAlchemy 0.6.0 版本&#xff08;也曾尝试使用 0.6.4 版本&#xff09;的 Pylons 应用程序中遇到了一个 SQLAlchemy ORM 问题。该问题出现在使用 psycopg2 作为数据库驱动程序、连接至 Postgresql 8.2 数据库的环境中。定义了一个 User 模型对象&#xf…

封装了一个仿照抖音评论轮播效果的iOS轮播视图

效果图 原理 就是我们在一个视图里面有两个子视图&#xff0c;一个是currentView, 一个是willShowView,在一次动画过程中&#xff0c;我们改变current View的frame&#xff0c;同时改变willShowView的frame&#xff0c;同时&#xff0c;需要改变currentVIew 的transform.y不然…

Linux操作系统:Redis在虚拟环境下的安装与部署

Redis下载方法 最近部署项目的时候用到了Redis&#xff0c;自己在安装的时候也碰到了一些列问题最终安装成功&#xff0c;记录一下自己的安装历程。前期准备&#xff1a; 服务器Linux版本&#xff1a;Centos8.4 64位&#xff08;http://isoredirect.centos.org/centos/8/isos/…

快速了解JVM机制

1.JVM 简介 JVM 是 Java Virtual Machine 的简称&#xff0c;意为 Java虚拟机。 虚拟机是指通过软件模拟的具有完整硬件功能的、运⾏在⼀个完全隔离的环境中的完整计算机系统。 常⻅的虚拟机&#xff1a;JVM、VMwave、Virtual Box。 JVM 和其他两个虚拟机的区别&#xff1a; V…

Ubuntu有线连接消失,无法联网怎么办!

今天重启 Ubuntu 虚拟机&#xff0c;突然之间发现没有网络&#xff0c;打开设置中的网络看&#xff0c;有线网络竟然消失了 经过一番查阅资料&#xff0c;发现解决问题很简单&#xff1a; 先看原因&#xff0c;输入命令 sudo lshw -c Network 检查所有的网络情况&#xff0c…

每天坚持写java锻炼能力---第一天(6.4)

今天的目标是菜单&#xff1a; B站/马士兵的项目菜单 package java1;import java.util.Scanner;public class Test {public static void main(String[] args) {while(true){ //3.加入死循环&#xff0c;让输入一直有System.out.println();System.out.println("--->项…

Python logging 模块详解

Python 的 logging 模块提供了一个强大而灵活的日志系统。它是 Python 标准库的一部分&#xff0c;因此可以在任何 Python 程序中使用。logging 模块提供了许多有用的功能&#xff0c;包括日志消息的级别设置、日志消息的格式设置、将日志消息输出到不同的目标&#xff0c;以及…

Java1.8 vue版家政服务系统成品源码 家政管家系统源码 家政月嫂系统源码 家政保洁系统源码 在线派单,师傅入驻全套商业源码

Java1.8 vue版家政服务系统成品源码 家政管家系统源码 家政月嫂系统源码 家政保洁系统源码 在线派单&#xff0c;师傅入驻全套商业源码 一、系统定义 家政上门服务系统是一种利用互联网技术&#xff0c;将家政服务需求与专业的家政服务人员进行高效匹配的平台。它允许用户通过…

信息系统项目管理师0146:输入(9项目范围管理—9.3规划范围管理—9.3.1输入)

点击查看专栏目录 文章目录 9.3 规划范围管理9.3.1 输入9.3 规划范围管理 规划范围管理是为了记录如何定义、确认和控制项目范围及产品范围,而创建范围管理计划的过程。本过程的主要作用是在整个项目期间对如何管理范围提供指南和方向。本过程仅开展一次或仅在项目的预定义点开…