【数据分析】表结构数据特征、获取、使用

文章目录

    • 表结构数据
    • 事实表及维度表
    • 表结构数据特征-1
    • 表结构数据特征-2
    • 处理缺失值-1
    • 表结构数据特征-3
    • 确定主键的方法
    • “应用”表格结构数据、“引用”表结构数据
    • 关系型数据库管理系统
    • 商业智能系统-BI
    • ETL功能
    • 数据仓库 - DW
    • OLAP
    • 表结构数据的横向合并
    • 表结构数据的横向合并1
    • 表结构数据的横向合并2
    • 表结构数据的横向合并3
    • 表结构数据的横向合并4
    • 表结构数据的横向合并5
    • 表结构数据的汇总1
    • 表结构数据的汇总2
    • 表结构数据的汇总3
    • 表结构数据的汇总4
    • 表结构数据的汇总5
    • 表结构数据的汇总6

表结构数据

以字段或记录作为数据的引用、操作及计算的基本单位的数据

  • 字段:整列数
  • 记录:整行数
  • 维度:业务角度
  • 度量:业务行为结果
  • 维度字段:文本型
  • 度量字段:数值型

在这里插入图片描述

事实表及维度表

维度表:只包含维度信息的表
事实表:既包含维度信息又包含度量信息的表
在这里插入图片描述

表结构数据特征-1

以字段或记录作为数据的引用、操作及计算的基本单位的数据

  • 第一行为标题行
  • 第二行以后称为记录
  • 字段名不能重名
  • 一个字段只能有一种数据类型

在这里插入图片描述

表结构数据特征-2

所有字段记录行数相同

  • 方形结构
  • 记录行数相同
  • 存在空值
  • 处理缺失值

在这里插入图片描述

处理缺失值-1

根据数据类型以及生成信息重要程度的不同,使用不同的方法处理缺失值

  • 文本型字段

  • 影响不大:以选择不进行处理,或者也可以用其他没有实际业务含义的文本字符对缺失值进行替换

  • 影响大:招业务人员进行确认后替换,或者与业务人员核实后删除

  • 数值型字段

  • 综合考虑该数值型字段所代表的度量意义以及针对该数值型字段进行汇总计算的方式来最终决定对缺失值的具体处理方法

在这里插入图片描述

表结构数据特征-3

一个表中有且只有一个主键

物理意义
单字段主键:由一个字段构成的主键
多字段联合主键:由多个字段构成的主键
非空不重复
定位记录行、字段名+主键值定位具体数值
多以“xxID”、“xxNo”、“xx编号”等名称命名
物理意义
表的业务记录单位,在一个数据表中的所有非主键字段都要围绕主键展开

确定主键的方法

  • 如果直接对数据库中的数据表进行操作,可以通过SQL语句确认数据表的字段
  • 如果间接在其他数据分析平台使用表结构数据(数据源是数据库中的数据表,使用时将数据源数据导入到其他平台使用),可以找原数据库中数据表的设计者咨询主键信息,或是直接查看数据表设计者留下的设计资料来对主键字段进行确认
  • 通过对数据表的业务意义进行分析,推测主键字段后再用物理手段确认推测的主键字段中的记录值是否能满足“非空”、“不重复”的要求来对主键字段进行确认
    在这里插入图片描述

“应用”表格结构数据、“引用”表结构数据

在这里插入图片描述

关系型数据库管理系统

关系型数据库管理系统的主要任务是企业业务数据的存储、检索、访问与共享

  • 多层级结构
  • OLTP
  • 可量化、结构化数据
  • 提供大部分数据源
  • 不善于分析
    在这里插入图片描述

商业智能系统-BI

数据库多用于存储数据,如果需要分析,BI工具更胜于为企业决策者快速提供完整、准确、深入的数据分析结果,帮助企业决策者实现商业洞察

  • 强于分析
  • 多功能模块构成
  • 两种主要类型
  • 多维数据集
  • 所见即所得
    在这里插入图片描述
    在这里插入图片描述

ETL功能

将数据从数据源端经过抽取(Extract)、清洗转换(Transform)之后加载(Load)到数据仓库

  • E-抽取:创建与不同数据源间的连接关系,对这些数据源中的数据进行“引用”
  • T-清洗转换:
  • 1 清洗的主要任务是筛选过滤不完整、错误及重复的数据记录
  • 2 对“粒度”不一致的数据进行转换
  • 3 对业务规则不一致的数据进行转换
  • L-加载:将抽取出来的数据经过清洗与转换后加载到数据仓库中进行存储与使用

数据仓库 - DW

用来存储分析所需要的不同数据源上的所有相关数据信息
在这里插入图片描述

OLAP

连接信息孤岛、创建多维数据模型
在这里插入图片描述

表结构数据的横向合并

将不同表中的字段信息合并到同一个表中使用
在这里插入图片描述

表结构数据的横向合并1

将不同表中的字段信息合并到同一个表中使用
在这里插入图片描述

表结构数据的横向合并2

将不同表中的字段信息合并到同一个表中使用
在这里插入图片描述

表结构数据的横向合并3

将不同表中的字段信息合并到同一个表中使用
在这里插入图片描述

表结构数据的横向合并4

将不同表中字段信息合并到同一个表中使用
在这里插入图片描述

表结构数据的横向合并5

将不同表中字段信息合并到同一个表中使用
在这里插入图片描述

表结构数据的汇总1

数据透视–对零散数据进行汇总分析
在这里插入图片描述

表结构数据的汇总2

数据透视-对零散数据进行汇总分析
在这里插入图片描述

表结构数据的汇总3

维度筛选度量、度量被维度筛选
在这里插入图片描述

表结构数据的汇总4

在这里插入图片描述

表结构数据的汇总5

将表格进行汇总统计,从销售业绩表得到透视表
在这里插入图片描述

表结构数据的汇总6

数据分析是连接零散数据与人类认知间的桥梁
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/491170.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【计算机网络】Layer4-Transport layer

目录 传输层协议How demultiplexing works in transport layer(传输层如何进行分用)分用(Demultiplexing)的定义:TCP/UDP段格式: UDPUDP的特点:UDP Format端口号Trivial File Transfer Protocol…

深入剖析MyBatis的架构原理

架构设计 简要画出 MyBatis 的架构图 >> ​​ Mybatis 的功能架构分为哪三层? API 接口层 提供给外部使用的接口 API,开发人员通过这些本地 API 来操纵数据库。接口层一接收到调用请求就会调用数据处理层来完成具体的数据处理。MyBatis 和数据库的…

CTF 攻防世界 Web: FlatScience write-up

题目名称-FlatScience 网址 index 目录中没有发现提示信息,链接会跳转到论文。 目前没有发现有用信息,尝试目录扫描。 目录扫描 注意到存在 robots.txt 和 login.php。 访问 robots.txt 这里表明还存在 admin.php admin.php 分析 在这里尝试一些 sql…

智能客户服务:科技赋能下的新体验

在当今这个数字化时代,客户服务已经不仅仅是简单的售后服务,它已竞争的关键要素之一。随着人工智能、大数据、云计算等技术的飞速发展,智能客户服务正逐步改变着传统的服务模式,为企业和消费者带来了前所未有的新体验。 一、智能客…

发布/部署WebApi服务器(IIS+.NET8+ASP.NETCore)

CS软件授权注册系统-发布/部署WebApi服务器(IIS.NET8ASP.NETCore) 目录 本文摘要VS2022配置发布VS2022发布WebApiIIS服务器部署WebApi 将程序文件复制到云服务器添加网站配置应用程序池配置dns域名配置端口阿里云ECS服务器配置19980端口配置https协议 (申请ssl证书)测试WebAp…

安卓 文件管理相关功能记录

文件管理细分为图片、视频、音乐、文件四类 目录 权限 静态声明权限 动态检查和声明权限方法 如何开始上述动态申请的流程 提示 图片 获取图片文件的对象列表 展示 删除 视频 获取视频文件的对象列表 获取视频file列表 按日期装载视频文件列表 展示 播放 删除…

找出1000以内的所有回文数

找出1000以内的所有回文数 方法概述检查回文数的方法伪代码C代码实现代码解析运行结果在计算机科学中,回文数是一种具有对称性质的数,即从左向右读和从右向左读都是相同的。例如,121、1331、12321都是回文数。本文将利用数据结构、C语言和算法的知识来编写一个程序,找出100…

如何在NGINX中实现基于IP的访问控制(IP黑白名单)?

大家好,我是锋哥。今天分享关于【如何在NGINX中实现基于IP的访问控制(IP黑白名单)?】面试题。希望对大家有帮助; 如何在NGINX中实现基于IP的访问控制(IP黑白名单)? 1000道 互联网大…

数据结构day3作业

一、完整功能【顺序表】的创建 【seqList.h】 #ifndef __SEQLIST_H__ #define __SEQLIST_H__#include <stdio.h> #include <string.h> #include <stdlib.h>//宏定义&#xff0c;线性表的最大容量 #define MAX 30//类型重定义&#xff0c;表示要存放数据的类…

云计算HCIP-OpenStack02

书接上回&#xff1a; 云计算HCIP-OpenStack01-CSDN博客 7.OpenStack核心服务 7.1Horizon&#xff1a;界面管理服务 Horizon提供了OpenStack中基于web界面的管理控制页面&#xff0c;用户或者是管理员都需要通过该服务进行OpenStack的访问和控制 界面管理服务需要依赖于keyston…

【Linux】基础IO-----重定向与缓冲区

目录 一、文件描述符分配规则&#xff1a; 二、重定向&#xff1a; 1、本质&#xff08;原理&#xff09;&#xff1a; 2、dup2的使用&#xff1a; 3、添加重定向功能到shell&#xff1a; 4、stdout与stderr&#xff1a; 三、Linux下一切皆文件&#xff1a; 四、缓冲区&…

音频客观测评方法PESQ

一、简介 语音质量感知评估&#xff08;Perceptual Evaluation of Speech Quality&#xff09;是一系列的标准&#xff0c;包括一种用于自动评估电话系统用户所体验到的语音质量的测试方法。该标准于2001年被确定为ITU-T P.862建议书[1]。PESQ被电话制造商、网络设备供应商和电…

ubuntu下anconda装pytorch

1、禁用nouveau sudo vim /etc/modprobe.d/blacklist.conf 在文件最后部分插入以下两行内容 blacklist nouveau options nouveau modeset0 更新系统 sudo update-initramfs -u 重启系统 2、装nvidia驱动 卸载原来驱动 sudo apt-get remove nvidia-* &#xff08;若安装…

Hyperledger Fabric 2.x 环境搭建

Hyperledger Fabric 是一个开源的企业级许可分布式账本技术&#xff08;Distributed Ledger Technology&#xff0c;DLT&#xff09;平台&#xff0c;专为在企业环境中使用而设计&#xff0c;与其他流行的分布式账本或区块链平台相比&#xff0c;它有一些主要的区别。 环境准备…

c++中类的应用综合练习

整理思维导图 课上类实现> 、<、!、||、&#xff01;和后自增、前自减、后自减运算符的重载 代码部分&#xff1a; #include <iostream> using namespace std; class complex {int rel;int vir; public:complex(int rel,int vir):rel(rel),vir(vir){}complex(){}…

视频智能分析平台LiteAIServer未戴安全帽检测算法助力矿山安全:精准监督矿工佩戴安全帽情况

矿山作业环境复杂多变&#xff0c;安全隐患层出不穷。其中&#xff0c;矿工未佩戴安全帽这一行为&#xff0c;看似微不足道&#xff0c;实则潜藏着巨大的安全风险。一旦发生事故&#xff0c;未佩戴安全帽的矿工将极易受到重创&#xff0c;甚至危及生命。因此&#xff0c;确保每…

k8s服务搭建与实战案例

Kubernetes&#xff08;K8s&#xff09;作为一个开源的容器编排平台&#xff0c;广泛应用于现代的云原生应用架构中。以下是一些常见的 **Kubernetes 实战案例**&#xff0c;包括从基础部署到高级应用场景的使用。通过这些案例&#xff0c;可以更好地理解 K8s 的运作原理和最佳…

JAVA学习日记(二十六)网络编程

一、网络编程的概念 常见的软件架构&#xff1a; 二、网络编程三要素 IP&#xff1a;设备在网络中的地址&#xff0c;是唯一的标识 端口号&#xff1a;应用程序在设备中的唯一标识 协议&#xff1a;数据在网络中传输的规则&#xff0c;常见的协议有UDP、TCP、http、https、f…

vue 设置 VUE_APP_TITLE 打包部署后不生效

VUE_APP_TITLE 名门望族云科技有限公司网站 这里的 名门望族云科技有限公司网站 两边不能加 (单引号) 部署后,浏览器刷新网站根目录

黑马头条day01 微服务搭建

1.请求调用流程 如http://localhost:8803/static/js/2.0195d7180dc783c3fe99.js这种静态资源&#xff0c;采用http的发送到本地8803端口的静态资源请求&#xff0c;而nginx配置的监听8801、8802、8803&#xff0c;所以请求走到nginx&#xff0c;nginx的admin配置文件 upstream…