数据分析入门

B站:01第一课 数据分析岗位职责和数据分析师_哔哩哔哩_bilibili

一、岗位:数据分析师

Q1 数据分析师在公司做什么工作? 

数据来源于公司核心业务,通过监测业务健康度来确定业务的健康状况;

通过对用户精细化分析,找出增长点,强化核心业务或开拓新业务。 

Q2 数据分析师使用什么工具?

使用sql对接数据源,excel对接业务人员。python在生产力方面与同行拉开差距。

Q3 数据分析师需要具备什么技术能力?

1.业务能力。在熟知业务的基础上,设计更加有价值的监测指标与用户埋点,获取更有价值的数据,为后续分析打下基础。

2.Excel、Sql、Python等分析软件。主要用于已获取数据的自动整合、监测、分发等,用来减轻人工的工作量。

3.统计学、数据分析报告、业务能力等。分析客观数据,得出分析结论。

4.BI平台。在该平台中完成上述工作,需要掌握平台的使用方法。

5.机器学习、搭建指标体系等相关知识。用于支撑核心业务增长或开拓新业务线。

6.行业报告分析。用于行业、数据探索。 

业务可以通过积极参与业务会议等方式掌握。和运营相比,掌握业务全局。

sql等工具通过系统学习和使用掌握。和表哥表姐相比,对业务有更深的掌握,通过数据分析总结。

数据分析通过系统的学习掌握。是数据分析师结果产出物,直接效益的体现。

python通过系统的学习掌握,用于加强自身竞争力,成为领域专家。

Q4 如何进行学习规划?

 

列出所需的技术栈,根据市场需求与自身特点(对自身是优势)分出优先级。

Q5 到达新公司后,如何迅速了解业务?

1.获得公司架构图。从中了解部门怎么设置,业务怎么开展。从用户到下订单的整个业务流程中,各部门如何参与,负责哪些业务。重点看运营架构、产品架构。

2.获取业务数据表。作为用户使用。获得主表、用户行为。

二、如何获得数据:指标体系与用户路径

Q1 指标可以用来干什么?

建立指标体系目的是获得全面而充足数据支撑,通过分析,从而发现问题、或得出主观问题的结论。 

优秀的指标体系在制定每个指标时,会与业务目标密切关联,紧密围绕活动策略,数据结果可以有效的衡量产品的健康程度与策略是否有效。  

 

Q2 指标包含什么构成要素?

Q3 面对混乱的指标数据时,如何将其定量比较?

指标之间因为计数单位、数据量、计算方式等量纲的不同,导致无法直接进行比较。

基于此问题,通常采用归一化标准化两种方法来去除量纲。 

  • 归一化:通过对同一组的统计量做统计,使该组数值在0-1之间变化。公式:(当前值-最小值)/(最大值-最小值)。归一化后,不同组数据即可做出比较。
  • 标准化:在计算一组数据的方差后,通过开根号的方式去除该组数据的量纲。 

Q4 如何拆分指标?  

1.在宏观上,从指标本身类型和获得复杂度来说,包括基础指标、复合指标和派生指标。

2.当聚焦在产品的不同生命周期阶段时,会产生各阶段的重点关注指标。

3.当细化到每个具体的业务时,从业务工作的拆分来讲,可根据业务的不同分为不同的指标类。 

4.对于互联网产品来说,会特别关注以下指标。 

5.从用户行为的角度来看,通过用户在关键路径上的一系列行为,为每个行为拆分测量指标。

Q5 如何分析用户路径?

视频类用户路径

电商购物用户路径 

内容平台用户路径

三、指标数据的分析 

Q1 获得指标数据后,可以分析什么信息? 

1.分析不同类型业务在整个业务中的占比情况

2.分析业务的增长趋势 

3.通过与自己、他人进行比较,分析业务的增长率和竞争力  

4.通过画象限的方法,分析出强势和弱势的业务  

5.通过对头部流量的分析,分析流量投入的集中程度 

6.通过对地域、用户、业务的维度分析,分析不同维度的用户对业务的偏好。  

TGI指数:在某个活动中,目标群体在总人群中的占比

——地域维度

——用户维度

——业务维度

06 复杂指标数据的影响因素有什么

指标的影响因素包括产品本身素质和用户群体两方面影响。

产品本身素质包括用户流量、转化率、成功率、价格等多项产品因素组成;用户群体为目标群体的群体特性。

用户群体作为对最为影响产品成功的部分,对受众群体做出细分,并进行完善的用户画像来研究。


四、分析的进行:统计

Q1 如何判断数据是否稳定?

描述统计学用于研究单个变量的集中趋势与离散趋势。 


选择一个数值来作为中心

Q2 确定中心数时,如何保证数据的代表性?



方差=[(数值1-平均数)²+(数值2-平均值)²+…]/N 

用来直观的对比离散程度的高低

标准差²=方差。去除方差的量纲,更精准的提现离散趋势

极差=(最大-最小) 。提现数据的偏差程度

偏差、方差共同描述离散程度。

Q3 如何判断数据范围?



Q4 如何找到异常值?

当数据服从正态分布,使用3σ原则

当数据不服从正态分布,使用箱线图


1.从小到大排列已有数据

2.选取25%,50%,75%,100%位距的数值

3.计算四分位距IQR,从而获得箱线图中箱子的长度;箱线图为数据提供3倍IQR的容错量。

IQR=Q3-Q1;上界=Q3+1.5IQR;下界=Q3-1.5IQR

4.根据数值画出箱线图,极限外的数据排除为异常数据

Q5 根据当前数据,如何预测接下来的趋势?

五、分析结果的运用

Q1 如何获得问题的结果?



1.罗列关联的数据(不同分析角度寻找不同数据)

2.列出公式,计算单位供给能力

3.列出公式,计算需求量

4.计算供给量


Q2 如何进行事件的策划?

人、时、地、事、因、做、果

把项目实际落地的具体手段。

策划产品活动案例

 

思考的基础是信息。若缺少信息,通过提问获得基础数据和细节。如:定价、产品价值、用户画像等。



分析付费点案例

拆分维度案例


Q3 如何分析用户的增长和留存?

常规模型:分析用户增长和留存的模型AARRR


拼多多模式:RARRA模型

留存——激活——传播——变现——注册

游戏化思路


游戏化用户增长策略:八角模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/162946.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java面试题总结(二):Java多线程

文章目录 1.进程和线程的区别,进程间如何通信2. 什么是线程上下文切换3.什么是死锁4.死锁的必要条件5.Synchronized和lock的区别6.什么是AQS锁?7.为什么AQS使用的双向链表?8.有哪些常见的AQS锁9.sleep()和wait()的区别10.yield()和join()区别11.线程池七…

【API篇】三、Flink转换算子API

文章目录 0、demo数据1、基本转换算子:映射map2、基本转换算子:过滤filter3、基本转换算子:扁平映射flatMap4、聚合算子:按键分区keyBy5、聚合算子:简单聚合sum/min/max/minBy/maxBy6、聚合算子:归约聚合re…

wsl使用vscode连接,远程安装C/C++ 拓展时,报错

报错内容: EACCES: permission denied, rename /home/wen/.vscode-server/extensions/.b61b1c7c-f703-4dfd-bdc5-d9a00681c4b7 -> /home/wen/.vscode-server/extensions/ms-vscode.cpptools-1.17.5-linux-x64 解决办法: 升级wsl到wsl2就好了。 &a…

GitLab使用webhook触发Jenkins自动构建

1、jenkins安装gitlab插件 在插件管理中,搜索gitlab安装这个插件。 2、job中配置webhook地址和密钥 进入job设置,构建触发器中就可以看到gitlab的webhook配置,复制URL地址和随机令牌至gitlab中 勾选后,就可以展开设置&#xff…

G.711语音编解码器详解

语音编解码利用人听觉上的冗余对语音信息进行压缩从而达到节省带宽的目的。值得注意的是,本文说的是语音编解码器,也就Speech codec,而常用的还有另一种编解码器称作音频编解码器,英文是Audio codec,它们的区别如下。 以前在学校的时候研究了很多VoIP的编解码器从G.723到A…

神经网络硬件加速器-DPU分析

一 DPU概述 DPU是专为卷积神经网络优化的可编程引擎,其使用专用指令集,支持诸多卷积神经网络的有效实现。 1、关键模块 卷积引擎:常规CONV等ALU:DepthwiseConvScheduler:指令调度分发Buffer Group:片上数据…

Kafka三种认证模式,Kafka 安全认证及权限控制详细配置与搭建

Kafka三种认证模式,Kafka 安全认证及权限控制详细配置与搭建。 Kafka三种认证模式 使用kerberos认证 bootstrap.servers=hadoop01.com:9092,hadoop02.com:9092,hadoop03.com:9092,hadoop04.com:9092 security.

信创办公–基于WPS的Word最佳实践系列 (图文环绕方式)

信创办公–基于WPS的Word最佳实践系列 (图文环绕方式) 目录 应用背景操作步骤1、 打开布局选项中图文环绕方式的方法2、 图文环绕三大类型 应用背景 在Word中,对文字和图片进行排版时,采用各种不同的图片与文字组合效果能够使页面…

php 遍历PHP数组的7种方式

在PHP中&#xff0c;遍历数组有多种方式可以选择。以下是最常用的几种方式&#xff1a; 使用foreach循环 $array array("apple", "banana", "orange"); foreach($array as $value){echo $value . "<br>"; } 输出结果&#xff…

【数组的使用续篇】

文章目录 以数组的形式打印数组打印方法&#xff1a;Arrays.toString(数组名) 数组排序大小排序方法是 Arrays.sort(数组名) 创建一个自己的打印数组的方法自己创建一个冒泡排序两数之间交换方法 逆置数组打印核心思路还是 i 和 j 交换 总结 以数组的形式打印数组 打印方法&am…

浅析“代码可视化” | 京东云技术团队

1.什么是代码可视化&#xff1f; Code visualization is the process of creating graphical representations of source code to help understand and analyze it. 代码可视化是创建源代码的图形表示以帮助理解和分析它的过程。 个人理解&#xff1a;通过使用图形化手段&#…

计算机保研推免面试复习大纲(数学+408)

目录 线性代数概率论高等数学信号与系统离散数学操作系统计算机网络计算机组成数据结构算法编译原理C杂项 线性代数 怎么求逆矩阵 逆矩阵&#xff1a; A A − 1 E AA^{-1}E AA−1E&#xff0c;伴随矩阵&#xff1a; A A ∗ A ∗ A ∣ A ∣ E AA^{*}A^{*}A|A|E AA∗A∗A∣A∣…

Top 10 数据恢复工具,可从iPhone 和 iPad 恢复数据

您是否正在寻找最好的 iPad 恢复软件&#xff0c;但不知道哪个选项最好&#xff1f;没有什么可担心的。本文将为您提供有关根据文件类型、设备兼容性和数据丢失原因等因素选择合适的 iPad 恢复软件的提示。此外&#xff0c;前 10 名提到的恢复软件是安全可靠的。 第 1 部分、iP…

上海亚商投顾:沪指震荡调整 转基因概念股逆势大涨

上海亚商投顾前言&#xff1a;无惧大盘涨跌&#xff0c;解密龙虎榜资金&#xff0c;跟踪一线游资和机构资金动向&#xff0c;识别短期热点和强势个股。 一.市场情绪 沪指昨日低开低走&#xff0c;深成指、创业板指均跌超1%&#xff0c;双双创出年内新低。转基因概念股逆势大涨…

开源Vue盲盒商城4.0源码/网页盲盒源码/前端uniapp后端thinkphp+安装教程/亲测

源码简介&#xff1a; 开源Vue盲盒商城4.0源码&#xff0c;它是打包小程序app的网页盲盒源码,亲测可用&#xff0c;它是采用vueTP5框架开发开源盲盒网站源码&#xff0c;附带了安装教程。 简单测试过了&#xff0c;可以使用&#xff0c;大家可以自测下。 前端uniapp后端think…

如何使用Python给图片添加水印

目录 一、安装Pillow库 二、导入Pillow库和需要用到的模块 三、添加水印 四、调用函数并设置参数 五、需要注意的方面 总结 在Python中&#xff0c;我们可以使用Pillow库来处理图像&#xff0c;包括添加水印。Pillow是Python中最流行的图像处理库之一&#xff0c;它支持多…

搭建Pytorch的GPU环境超详细

效果 1、下载和安装VS2019 https://visualstudio.microsoft.com/zh-hans/vs/older-downloads/ 登录需要用户名和密码 安装后需要联网下载组件的,安装的时候要勾选使用C++的桌面开发 2、下载和安装显卡驱动 查看自己的显卡型号 从英伟达下载和安装最新驱动

【面试经典150 | 区间】插入区间

文章目录 Tag题目解读题目来源解题思路方法一&#xff1a;合并区间方法二&#xff1a;模拟 其他语言python3 写在最后 Tag 【模拟】【数组】 题目解读 给定一个含有多个无重叠区间的数组&#xff0c;并且数组已经按照区间开始值升序排序。在列表中插入一个新的区间&#xff0…

【nginx学习笔记】

1.正向代理&#xff1a;代理的是客户端&#xff0c;一般有明确的访问对象 比如&#xff1a;我现在通过v-p-n去访问YouTube&#xff0c;那么就是正向代理。 2.反向代理&#xff1a;代理的是服务器 最常见的就是web中&#xff0c;nginx去代理一群后端的服务器。 3.负载均衡&…

solidworks 2024新功能之-打造更加智能的工作 硕迪科技

SOLIDWORKS 2024 的新增功能 SOLIDWORKS 的每个版本都致力于改进您的工作流程&#xff0c;使您常用的工具尽可能快速高效地运作。此外&#xff0c;SOLIDWORKS 2024 可以通过量身定制的解决方案扩展您的工具集&#xff0c;并使您能够通过 Cloud Services 轻松将您的设计数据连接…