此文是转载的,转载了我朋友的。
今天给大家分享一下数据分析基础的一些学习笔记,希望对你有用。
生活中我们总能遇见一些喜欢说“我认为”、“我觉得”的人,不知道你们平时遇到这种人是什么感受呢?
在平时中还好,假如在工作中可能会被问的哑口无言,那么怎么解决这些“我认为”、“我觉得”这种问题呢?为了使我们的观点有足够的说服力,就需要用数据说话,用数据来论证你的观点,体现你观点的严谨性。这也是产品经理所要具备基础能力。这里就以产品经理岗位的角色讲解数据分析。
一、什么是数据分析
数据分析是对于一个问题一个完整的闭环研究过程,需要我们先确定数据分析的目标,即明确的目标性,确定目标后,需要进行数据的收集、整理、加工、分析,有了数据后需要在繁杂的数据中获取有价值的信息,通过这个信息能够帮助指导我们的产品决策。进行数据分析一定要有对比,有指标,这样我们的分析才不是纸上谈兵,这样才是有意义的。
二、数据分析的作用
(1)反应产品情况,数据反映出来的问题更为客观,告别“我认为”、“我觉得”。(2)发现产品问题,数据会将问题很直观的暴露出来。(3)寻找最佳决策,通过数据可以以最小的成本得到相对比较高的回报率,A/B测试可以帮助我们寻找最佳决策。(4)掌握产品生态,通过竞品分析,同行业之间的观察。(5)发现产品线索,可以通过数据反映出产品的留存趋势情况,为后续产品的迭代提供理论支撑。
三、数据分析的分类
数据分析共分为三种,(1)描述性分析,最常见的一种分析方法,将统计到的数据进行描述变成报告。充分利用可视化工具增强描述性分析所带来的信息;(2)诊断性分析,对日常数据的变化进行合理的解释,这是描述分析的下一步难题。从这个阶段开始,才刚刚进入真正的数据分析阶段;(3)预测性分析,根据数据的预测结果调整产品方案,预测性分析主要是进行预测。某事件在将来发生的可能性,预测一个可量化的值,或者是估计事情可能发生的某个时间点,这些都可以通过预测模型完成。
四、数据驱动产品设计
当我们推出一个新的产品功能的时候,是否是符合用户预期的,是否是受用户欢迎,我们需要通过数据来说话。主观认知总会有一些偏差,但是数据是不会说谎的。通过可量化的数据能够对新功能给予较为客观的反馈,从而驱动下一步的产品决策。
数据验证产品设计,将我们的想法落地到产品中,产品的具体表现通过数据进行展现,数据回归到我们到想法中,通过数据可以去验证我们的产品想法是否符合我们的产品目标
数据决策产品设计,根据现有的数据反馈,产生设计解决方案,进行决策产品的下一步走向,开发上线后,通过数据验证我们的想法是否符合我们的预期。
五、怎么做数据分析
1.确定分析的内容,即需要先根据确定的目的,把它分解成若干个不同的分析要点,明确需要从那几个方面,哪几个点进行分析。
2.收集相关的数据,根据最初确定的目标和内容去收集相关、有用的数据外部数据和内部数据。
3.数据预处理,其主要包括数据清洗和数据加工。一般收集到的数据比较繁杂,没法直接使用。所以要对收集到的数据提前进行数据加工处理,从而形成适合数据分析的格式、样式。
4.数据预处理完成后才真正开始进入数据分析的实施阶段,根据之前确定的目标和内容,利用各种统计分析的方法,发现数据与数据的内部关系和规律,为产品迭代提供指导意义。
5.数据可视化,将分析的结果用图表的形式展现出来,可以更有效的、更直观的传达出数据与数据之间的关系,还对可视展示的内容进行解释,常用的图表包括饼图、折线图、柱形图、散点图、雷达图等,金字塔图、矩阵图、漏斗图、帕累托图(帕累托图是将出现的质量问题和质量改进项目按照重要程度依次排列而采用的一种图表。以意大利经济学家V.Pareto的名字而命名的。帕累托图又叫排列图、主次图,是按照发生频率大小顺序绘制的直方图,表示有多少结果是由已确认类型或范畴的原因所造成)。
6.撰写数据报告,对整个数据分析过程的一个总结和呈现,主要目的是把分析的背景、过程、结果和建议完整地呈现出来,以供决策者展开,一定要给出明确的结论,因为有目的就一定要有结果(形成闭环)。
7.上线验证结论,设定了目标,最后就要验证目标,不然你永远都不知道自己做的对不对 。
8.数据分析复盘
六、数据分析必须知道的基本术语
1.指标
用于衡量事物发展程度的单位或方法,也是一种度量。例如:人口数、GDP、收入、用户数、利润率、留存率、覆盖率等。很多公司都有自己的KPI指标体系,就是通过几个关键指标来衡量公司业务运营情况的好坏。
2.纬度
是食物或现象的某种特种,如性别、地区、时间等都是纬度。其中时间是一种常用、特殊的纬度,通过时间前后的对比,就可以知道谁的发展是好是坏了,如用户数比上月增长10%,比去年同期增长20%,这就是时间上的对比,也称为纵比。另一个比较就是横比,如不同国家人口数、GDP的比较、不同省份的收入、用户数的比较、不同公司、不同部门之间的比较,这些都是同级单位之间的比较,简称横比。
3.均值、众数、中位数
均数即平均数的一般度量,能够利用所有已知信息,对异常值很敏感;中位数,高中学统计概率的时候也有学过,排序居于中间的位置;众数,出现最频繁的数值,代表分布中的高峰。
4.绝对数与相对数
绝对数,他是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合指标;相对数:指由两个联系的指标对比计算而得到的数值,它是用于反映客观现象之间的数量联系程度的综合指标。
5.百分比和百分点
百分比:表示一个数是另一个数的百分之几,也叫做百分率或百分数;百分点:指不同时间以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。
6.频数与频率
频数是指一组数据中个别数据重复出现的次数;频率是每组类别次数与总次数的比值。
7.倍数与番数
倍数是一个数除以另一个数所得的商;番数是指原来数量的2的N次方。
8.比例与比率
比例是指总体中各部分的数值占全部数值的比重,通常反应总体的构成和结构
比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
9.同比、环比、定基比
环比是指本期统计数据与上期比较;同比是指今年第n月与去年第n月比;定基比是指和某个基点进行比较 。