【数据分析】统计量

【数据分析】统计量

news/2024/12/24 3:29:27/文章来源:https://blog.csdn.net/weixin_42322991/article/details/132533543

1. 均值、众数描述数据的集中趋势度量，四分位差、极差描述数据的离散程度。

2. 标准差、四分位差、异众比率度量离散程度，协方差是度量相关性。

期望值分别为E[X]与E[Y]的两个实随机变量X与Y之间的协方差Cov(X,Y)定义为：

从直观上来看，协方差表示的是两个变量总体误差的期望。

如果X与Y是统计独立的，那么二者之间的协方差就是0，因为两个独立的随机变量满足E[XY]=E[X]E[Y]。

但是，反过来并不成立。即如果X与Y的协方差为0，二者并不一定是统计独立的。

3. 卡方检验可以分析分类变量之间的相关性。http://t.csdn.cn/SZSy6

4. t检验：t检验，亦称student t检验（Student's t test），主要用于样本含量较小（例如n < 30），总体标准差σ未知的正态分布。只能分析数值型变量。

5. 皮尔逊相关系数是一种衡量变量之间线性关系强弱的统计量。它的取值范围在-1到1之间，可以反映出两个变量之间的相关程度。如果相关系数接近1，表明两个变量之间存在完全正向的线性关系；如果接近-1，则说明存在完全负向的线性关系；如果接近0，则表示两个变量之间没有线性关系。

皮尔逊相关系数的计算方法如下：

r = Cov(X, Y) / (σX * σY)

其中，Cov(X, Y)表示变量X和Y的协方差，σX和σY分别表示变量X和Y的标准差。通过计算协方差和标准差，我们可以得到两个变量之间的相关系数。

只能分析数值型变量。

例子：百度安全验证

6. 列联相关：列联相关又称列联相关系数(contingencycorrelation)又称均方相依系数或接触系数，是指当两列数据中至少有一列是多分类资料时，描述变量之间的相互关系的品质相关系数。

可以分析分类变量之间的相关性。

7. SQL中的关键字：float浮点型、int 整数型、char 文本型、decimal 定点型

8. HAVING 子句中的筛选字段必须是可以出现在分组结果中的字段

9. 多维数据库——雪花模式

雪花模式是集中代表事实表的连接到多个层面，是类似星型模式。

星型模型：星型模式是多维的数据关系，它由事实表（Fact Table）和维表（Dimension Table）组成。每个维表中都会有一个维作为主键，所有这些维的主键结合成事实表的主键。事实表的非主键属性称为事实，它们一般都是数值或其他可以进行计算的数据。

交叉模型：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/109160.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Vue2向Vue3过度核心技术自定义指令

Vue2向Vue3过度核心技术自定义指令

目录 1 自定义指令1.指令介绍2.自定义指令3.自定义指令语法4.指令中的配置项介绍5.代码示例6.总结 2 自定义指令-指令的值1.需求2.语法3.代码示例 3 自定义指令-v-loading指令的封装1.场景2.需求3.分析4.实现5.准备代码 1 自定义指令 1.指令介绍内置指令：v-html、v…

阅读更多...

channel并发编程

channel并发编程

不要通过共享内存通信，要通过通信共享内存。 channel是golang并发编程中一种重要的数据结构，用于多个goroutine之间进行通信。我们通常可以把channel想象成一个传送带，将goroutine想象成传送带周边的人，一个传送带的上游放上物品…

阅读更多...

四信重磅推出5G RedCap AIoT摄像机 RedCap轻量级5G终端新品首发!

四信重磅推出5G RedCap AIoT摄像机 RedCap轻量级5G终端新品首发!

6月6日，四信受邀出席移动物联网高质量发展论坛，并在移动物联网新产品发布环节隆重推出5G RedCap AIoT摄像机，再次抓紧需求先机，为行业用户创造无限可能！ 两大应用场景助推RedCap走深向实火遍全网络的RedCap应用场景可…

阅读更多...

【JavaEE进阶】MyBatis表查询

【JavaEE进阶】MyBatis表查询

文章目录一. 使用MyBatis完成数据库的操作1. MyBatis程序中sql语句的即时执行和预编译1.1 即时执行（${}）1.2 预编译（#{}）1.3 即时执行和预编译的优缺点 2. 单表的增删改等操作2.1 增加操作2.2 修改操作2.3 删除操作2.4 like(模糊…

阅读更多...

LeetCode538. 把二叉搜索树转换为累加树

LeetCode538. 把二叉搜索树转换为累加树

538. 把二叉搜索树转换为累加树文章目录 [538. 把二叉搜索树转换为累加树](https://leetcode.cn/problems/convert-bst-to-greater-tree/)一、题目二、题解方法一：递归（中序遍历与节点更新）方法二：反向中序遍历与累加更新&#x…

阅读更多...

JavaFX 加载 fxml 文件

JavaFX 加载 fxml 文件

JavaFX 加载 fxml 文件主要有两种方式，第一种方式通过 FXMLLoader 类直接加载 fxml 文件，简单直接，但是有些控件目前还不知道该如何获取，所以只能显示，目前无法处理。第二种方式较为复杂，但是可以使用与 fx…

阅读更多...

初阶数据结构（六）队列的介绍与实现

初阶数据结构（六）队列的介绍与实现

💓博主csdn个人主页：小小unicorn💓 ⏩专栏分类：C 🚚代码仓库：小小unicorn的学习足迹🚚 🌹🌹🌹关注我带你学习编程知识栈队列的介绍队列的概念：队…

阅读更多...

GWO-LSTM交通流量预测（python代码）

GWO-LSTM交通流量预测（python代码）

使用 GWO 优化 LSTM 模型的参数，从而实现交通流量的预测方法代码运行版本要求 1.项目文件夹 data是数据文件夹，data.py是数据归一化等数据预处理脚本 images文件夹装的是不同模型结构打印图 model文件夹 GWO-LSTM测试集效果效果视频：GWO…

阅读更多...

SNN论文总结

SNN论文总结

Is SNN a great work ? Is SNN a convolutional work ? ANN的量化在SNN中是怎么体现的，和threshold有关系吗，threshold可训练和这个有关吗（应该无关） 解决过发放不发放的问题。 Intuation SNN编码方式 Image to spike patter…

阅读更多...

stm32之19.温湿度模块（待补充）

stm32之19.温湿度模块（待补充）

dth11.c文件① #include "dht11.h" #include "delay.h"// 1、温湿度模块初始化(PG9) void Dht11_Init(void) {// 0、GPIO外设信息结构体GPIO_InitTypeDef GPIO_InitStruct;// 1、使能硬件时钟 RCC_AHB1PeriphClockCmd(RCC_AHB1Periph_GPIOG, ENABLE);//…

阅读更多...

Pyqt5开发实战记录

Pyqt5开发实战记录

入职以来第一个开发项目： 1、如何给Qlabel加边框：右键label对象，选择“改变样式表”输入一下代码： border: 1px solid black;2、如何让垂直布局中button大小不发生变化：其实很简单，只需要设置button的最大…

阅读更多...

【seaweedfs】2、Finding a needle in Haystack: Facebook’s photo storage 分布式对象存储论文

【seaweedfs】2、Finding a needle in Haystack: Facebook’s photo storage 分布式对象存储论文

文章目录一、介绍二、背景、设计理念2.1 背景2.2 NFS-based Design2.3 Discussion 三、设计和实现3.1 概览3.2 Haystack Directory3.3 Haystack Cache3.4 Haystack Store3.4.1 Photo Read3.4.2 Photo Write3.4.3 Photo Delete3.4.4 The Index File3.4.5 Filesystem 3.5 Recove…

阅读更多...

WebGL 缓冲区对象介绍，创建并使用缓冲区，使用缓冲区对象向顶点着色器传入多个顶点数据的所有步骤

WebGL 缓冲区对象介绍，创建并使用缓冲区，使用缓冲区对象向顶点着色器传入多个顶点数据的所有步骤

目录使用缓冲区对象使用缓冲区对象向顶点着色器传入多个顶点的数据，需要遵循以下五个步骤。创建缓冲区对象（gl.createBuffer（）） gl.createBuffer（）的函数规范 gl.deleteBuffer &#…

阅读更多...

C# winform加载yolov8模型测试（附例程）

C# winform加载yolov8模型测试（附例程）

第一步：在NuGet中下载Yolov8.Net 第二步：引用 using Yolov8Net; 第三步：加载模型 private IPredictor yolov8 YoloV8Predictor.Create("D:\\0MyWork\\Learn\\vs2022\\yolov_onnx\\best.onnx", mylabel); 第四步：图…

阅读更多...

【OpenCV • c++】图像对比度调整 | 图像亮度调整

【OpenCV • c++】图像对比度调整 | 图像亮度调整

🚀 个人简介：CSDN「博客新星」TOP 10 ， C/C 领域新星创作者💟 作者：锡兰_CC ❣️📝 专栏：【OpenCV • c】计算机视觉🌈 若有帮助，还请关注➕点赞➕收藏&#xff…

阅读更多...

window系统中如何判断是物理机还是虚拟机及VMPROTECT无法检测云主机

window系统中如何判断是物理机还是虚拟机及VMPROTECT无法检测云主机

为什么要判断物理机，因为授权不能对虚拟机安装后的软件进行授权。虚拟机可以复制可以克隆，无法作为一个不可复制ID来使用。总结了如何判断物理机： 1. 用systeminfo的系统型号。（注，有资料是看处理器和bios。但是我这…

阅读更多...

一步一步实验，讲解python中模块和包的使用

一步一步实验，讲解python中模块和包的使用

背景为什么要提出这个问题？ 在一个项目中，每一个python文件打开后，都会看到依赖了其他的一些包、模块等；概念混乱，魔改目标不清晰为什么要修改？ 如果需要将某开源包进行自定义处理，不再使…

阅读更多...

Python 包管理（pip、conda）基本使用指南

Python 包管理（pip、conda）基本使用指南

Python 包管理概述介绍 Python 有丰富的开源的第三方库和包，可以帮助完成各种任务，扩展 Python 的功能，例如 NumPy 用于科学计算，Pandas 用于数据处理，Matplotlib 用于绘图等。在开始编写 Pytlhon 程序之前&#…

阅读更多...

数据隐私与安全在大数据时代的挑战与应对

数据隐私与安全在大数据时代的挑战与应对

文章目录数据隐私的挑战数据安全的挑战应对策略和方法1. 合规和监管2. 加密技术3. 匿名化和脱敏4. 安全意识培训5. 隐私保护技术结论 🎈个人主页：程序员小侯 🎐CSDN新晋作者 🎉欢迎 👍点赞✍评论⭐收藏 ✨收录专栏&…

阅读更多...

【算法与数据结构】513、LeetCode找树左下角的值

【算法与数据结构】513、LeetCode找树左下角的值

文章目录一、题目二、解法三、完整代码所有的LeetCode题解索引，可以看这篇文章——【算法和数据结构】LeetCode题解。一、题目二、解法思路分析：这道题用层序遍历来做比较简单，最底层最左边节点就是层序遍历当中最底层元素容器的第一个值…

阅读更多...

最新文章

推荐文章