数据分析:用适当的分析方法和挖掘方法对收集来的数据进行研究总结,提取有用的信息,形成结论并支持决策的过程。
一.数据分析的分类
1.业务描述性分析。以数据为分析对象,以探索数据内的有用信息为主要途径,以解决业务需求为最终目标,包含业务理解、数据采集、数据清洗、数据探索、数据可视化、数据建模、模型可视化、分析结果的业务应用等步骤在内的一整套分析流程。
2.数据挖掘。一个横跨计算机、数学、统计学等学科的科学分支。它用人工智能、机器学习、统计学和数据库的交叉方法在相对较大模型的数据集中发现信息的计算过程。
二.数据分析的基础流程
1.业务描述性分析流程概述
(1)业务理解。是业务描述性分析的起点,也是流程中最重要的步骤,要求分析人员能够全面、准确地理解业务问题及业务需求,并结合业务需求制定完整的分析计划。
(2)数据获取。是基于业务分析需求,从多渠道全面地获取分析数据的步骤。在业务描述性分析中用到的数据以结构数据为主,数据获取阶段得到的数据没有质量保证,不能直接用来进行分析,需要进一步处理。直接获取到的、未经加工的数据称为“原始数据(Raw Data)”。
(3)数据处理。是将原始数据进行清洗、加工,从而得到高质量的可用来进行分析的有效数据的过程。
(4)数据分析。是对处理过后的有效数据进行业务描述性分析的过程。
(5)结果展现。是将分析结果以业务分析报告或可视化分析报表(仪盘表、商业智能报表等)的形式呈现给业务决策者的过程。在结果展现环节要求内容准确、客观、全面、直观、易懂。
2.数据挖掘流程概述
(1)业务理解
(2)数据理解
(3)数据准备
(4)建模
(5)模型评估
(6)模型发布
三.数据分析的落地方法
1.业务运行探索(E)
2.问题原因诊断(D)
3.业务策略指导(I)
4.数据算法工具(T)