B站:01第一课 数据分析岗位职责和数据分析师_哔哩哔哩_bilibili
一、岗位:数据分析师
Q1 数据分析师在公司做什么工作?
数据来源于公司核心业务,通过监测业务健康度来确定业务的健康状况;
通过对用户精细化分析,找出增长点,强化核心业务或开拓新业务。
Q2 数据分析师使用什么工具?
使用sql对接数据源,excel对接业务人员。python在生产力方面与同行拉开差距。
Q3 数据分析师需要具备什么技术能力?
1.业务能力。在熟知业务的基础上,设计更加有价值的监测指标与用户埋点,获取更有价值的数据,为后续分析打下基础。
2.Excel、Sql、Python等分析软件。主要用于已获取数据的自动整合、监测、分发等,用来减轻人工的工作量。
3.统计学、数据分析报告、业务能力等。分析客观数据,得出分析结论。
4.BI平台。在该平台中完成上述工作,需要掌握平台的使用方法。
5.机器学习、搭建指标体系等相关知识。用于支撑核心业务增长或开拓新业务线。
6.行业报告分析。用于行业、数据探索。
业务可以通过积极参与业务会议等方式掌握。和运营相比,掌握业务全局。
sql等工具通过系统学习和使用掌握。和表哥表姐相比,对业务有更深的掌握,通过数据分析总结。
数据分析通过系统的学习掌握。是数据分析师结果产出物,直接效益的体现。
python通过系统的学习掌握,用于加强自身竞争力,成为领域专家。
Q4 如何进行学习规划?
列出所需的技术栈,根据市场需求与自身特点(对自身是优势)分出优先级。
Q5 到达新公司后,如何迅速了解业务?
1.获得公司架构图。从中了解部门怎么设置,业务怎么开展。从用户到下订单的整个业务流程中,各部门如何参与,负责哪些业务。重点看运营架构、产品架构。
2.获取业务数据表。作为用户使用。获得主表、用户行为。
二、如何获得数据:指标体系与用户路径
Q1 指标可以用来干什么?
建立指标体系目的是获得全面而充足数据支撑,通过分析,从而发现问题、或得出主观问题的结论。
优秀的指标体系在制定每个指标时,会与业务目标密切关联,紧密围绕活动策略,数据结果可以有效的衡量产品的健康程度与策略是否有效。
Q2 指标包含什么构成要素?
Q3 面对混乱的指标数据时,如何将其定量比较?
指标之间因为计数单位、数据量、计算方式等量纲的不同,导致无法直接进行比较。
基于此问题,通常采用归一化和标准化两种方法来去除量纲。
- 归一化:通过对同一组的统计量做统计,使该组数值在0-1之间变化。公式:(当前值-最小值)/(最大值-最小值)。归一化后,不同组数据即可做出比较。
- 标准化:在计算一组数据的方差后,通过开根号的方式去除该组数据的量纲。
Q4 如何拆分指标?
1.在宏观上,从指标本身类型和获得复杂度来说,包括基础指标、复合指标和派生指标。
2.当聚焦在产品的不同生命周期阶段时,会产生各阶段的重点关注指标。
3.当细化到每个具体的业务时,从业务工作的拆分来讲,可根据业务的不同分为不同的指标类。
4.对于互联网产品来说,会特别关注以下指标。
5.从用户行为的角度来看,通过用户在关键路径上的一系列行为,为每个行为拆分测量指标。
Q5 如何分析用户路径?
视频类用户路径
电商购物用户路径
内容平台用户路径
三、指标数据的分析
Q1 获得指标数据后,可以分析什么信息?
1.分析不同类型业务在整个业务中的占比情况
2.分析业务的增长趋势
3.通过与自己、他人进行比较,分析业务的增长率和竞争力
4.通过画象限的方法,分析出强势和弱势的业务
5.通过对头部流量的分析,分析流量投入的集中程度
6.通过对地域、用户、业务的维度分析,分析不同维度的用户对业务的偏好。
TGI指数:在某个活动中,目标群体在总人群中的占比
——地域维度
——用户维度
——业务维度
06 复杂指标数据的影响因素有什么
指标的影响因素包括产品本身素质和用户群体两方面影响。
产品本身素质包括用户流量、转化率、成功率、价格等多项产品因素组成;用户群体为目标群体的群体特性。
用户群体作为对最为影响产品成功的部分,对受众群体做出细分,并进行完善的用户画像来研究。
四、分析的进行:统计
Q1 如何判断数据是否稳定?
描述统计学用于研究单个变量的集中趋势与离散趋势。
选择一个数值来作为中心
Q2 确定中心数时,如何保证数据的代表性?
方差=[(数值1-平均数)²+(数值2-平均值)²+…]/N
用来直观的对比离散程度的高低
标准差²=方差。去除方差的量纲,更精准的提现离散趋势
极差=(最大-最小) 。提现数据的偏差程度
偏差、方差共同描述离散程度。
Q3 如何判断数据范围?
Q4 如何找到异常值?
当数据服从正态分布,使用3σ原则
当数据不服从正态分布,使用箱线图
1.从小到大排列已有数据
2.选取25%,50%,75%,100%位距的数值
3.计算四分位距IQR,从而获得箱线图中箱子的长度;箱线图为数据提供3倍IQR的容错量。
IQR=Q3-Q1;上界=Q3+1.5IQR;下界=Q3-1.5IQR
4.根据数值画出箱线图,极限外的数据排除为异常数据
Q5 根据当前数据,如何预测接下来的趋势?
略
五、分析结果的运用
Q1 如何获得问题的结果?
1.罗列关联的数据(不同分析角度寻找不同数据)
2.列出公式,计算单位供给能力
3.列出公式,计算需求量
4.计算供给量
Q2 如何进行事件的策划?
人、时、地、事、因、做、果
把项目实际落地的具体手段。
策划产品活动案例
思考的基础是信息。若缺少信息,通过提问获得基础数据和细节。如:定价、产品价值、用户画像等。
分析付费点案例
拆分维度案例
Q3 如何分析用户的增长和留存?
常规模型:分析用户增长和留存的模型AARRR
拼多多模式:RARRA模型
留存——激活——传播——变现——注册
游戏化思路
游戏化用户增长策略:八角模型