Python | Bootstrap图介绍

在进入Bootstrap 图之前,让我们先了解一下Bootstrap(或Bootstrap 抽样)是什么。

Bootstrap 抽样(Bootstrap Sampling):这是一种方法,我们从一个数据集中重复地取一个样本数据来估计一个总体参数。它用于确定总体的各种参数。

Bootstrap图

Bootstrap图是从数据样本计算的统计量分布的图形表示。它通常用于可视化统计量的可变性和不确定性,例如平均值或标准差,通过显示统计量在许多Bootstrap数据样本上的分布。

在bootstrap图中,x轴表示统计量的值,y轴表示这些值的频率。为每个Bootstrap样本绘制一条线,线的高度表示该样本中统计值的频率。线的分布表示统计量在Bootstrap样本上的分布。

Bootstrap图是理解统计量中的不确定性的强大工具,特别是当数据的潜在分布未知或复杂时。它还可以用来生成统计量的置信区间,并比较不同统计量的分布。

需要注意的是,Bootstrap是一种重新估计技术,用于估计样本中统计量的不确定性,而无需对数据的潜在分布进行任何假设。它可用于估计标准误差、置信区间和执行假设检验。

Bootstrap plot:Bootstrap plot是一种图形方法,用于测量总体的任何期望统计特征的不确定性。它是置信区间的一种替代方法。(也用于计算统计量的数学方法)。

如何使用Bootstrap

通常,我们可以用数学方法计算总体统计量的不确定性,使用置信区间。然而,在许多情况下,推导出的不确定性公式在数学上是难以处理的。在这种情况下,我们使用Bootstrap plot。

假设,我们有5000人在一个公园里,我们需要找到整个人口的平均体重。测量每个人的体重然后取平均值是不可行的。这就是bootstrap抽样的用武之地。

我们从人群中随机抽取5人一组,然后求出平均值。然后,我们做同样的过程8-10次。通过这种方式,我们可以更有效地获得对总体平均权重的良好估计。

举个例子:

让我们考虑一个例子,了解Bootstrap图如何使从大量人口中获得关键信息变得更容易。假设我们有3000个随机生成的统一数字的样本数据。我们取出30个数字的子样本,并找到其平均值。我们对另一个随机子样本再次这样做,依此类推。

我们绘制了上述信息的bootstrap 图,只需查看它,我们就可以很容易地给予关于所有3000个数字的平均值的很好的估计。还有各种其他有用的信息可以从bootstrap 图中获得,例如:

  • 哪个子样本的方差最小,
  • 哪个子样本创建最小置信区间等。

Python简单实现

import pandas as pd
import numpy as nps = pd.Series(np.random.uniform(size=500))
pd.plotting.bootstrap_plot(s)

在这里插入图片描述
说明:

  1. Bootstrap图给出了总体所需信息的估计值,而不是精确值。
  2. 它高度依赖于给定的数据集。当大量子集具有重复样本时,它不能给予好的结果。
  3. 当我们获得的信息高度依赖于尾值时,Bootstrap图变得无效。

Bootstrap的优缺点

优点:

  • 它是一种非参数方法,这意味着它不需要对数据的潜在分布进行任何假设。
  • 它可用于估计各种统计量的标准误差和置信区间。
  • 它可以用来估计统计量的不确定性,即使样本量很小。
  • 它可用于执行假设检验和比较不同统计量的分布。
  • 在统计、金融、机器学习等多个领域有着广泛的应用。

缺点:

  • 它可能是计算密集型的,特别是在处理大型数据集时。
  • 它可能不适用于所有类型的数据,例如高度偏斜或重尾分布。
  • 它可能不适合估计具有非常大方差的统计数据的不确定性。
  • 它可能不适用于估计不平滑或方差差异很大的统计数据的不确定性。
  • 它可能并不总是一个很好的替代其他统计方法,如渐近方法,当大样本量可用时。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/275744.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Capture One 23:光影魔术师,细节掌控者mac/win版

Capture One 23,不仅仅是一款摄影后期处理软件,它更是摄影师们的得力助手和创意伙伴。这款软件凭借其卓越的性能、丰富的功能和前沿的技术,为摄影师们带来了前所未有的影像处理体验。 Capture One 23软件获取 Capture One 23以其强大的色彩…

【C++教程从0到1入门编程】第八篇:STL中string类的模拟实现

一、 string类的模拟实现 下面是一个列子 #include <iostream> namespace y {class string{public: //string() //无参构造函数// :_str(nullptr)//{}//string(char* str) //有参构造函数// :_str(str)//{}string():_str(new char[1]){_str[0] \0;}string(c…

RuoYi开源项目1-下载并实现运行RuoYi项目

下载并实现运行RuoYi项目 环境需要下载项目项目配置后端项目配置前端项目配置 启动后前端登录页面截图 环境需要 JDK > 8MySQL >5.7Maven > 3.0Node > 12Redis > 3 下图是我的环境配置 下载项目 若依官网 1.进入官网&#xff0c;下载版本如下图RuoYi-Vue前后…

【Vue2】组件通信

父子通信 父 -> 子 子 -> 父 props 校验 props: {校验的属性名: {type: 类型, // Number String Boolean ...required: true, // 是否必填default: 默认值, // 默认值validator (value) {// 自定义校验逻辑return 是否通过校验}} },data 的数据是自己的 → 随便改pr…

【2024-完整版】python爬虫 批量查询自己所有CSDN文章的质量分:附整个实现流程

【2024】批量查询CSDN文章质量分 写在最前面一、分析获取步骤二、获取文章列表1. 前期准备2. 获取文章的接口3. 接口测试&#xff08;更新重点&#xff09; 三、查询质量分1. 前期准备2. 获取文章的接口3. 接口测试 四、python代码实现1. 分步实现2. 批量获取文章信息3. 从exce…

豆瓣书影音存入Notion

使用Python将图书和影视数据存放入Notion中。 &#x1f5bc;️介绍 环境 Python 3.10 &#xff08;建议 3.11 及以上&#xff09;Pycharm / Vs Code / Vs Code Studio 项目结构 │ .env │ main.py - 主函数、执行程序 │ new_book.txt - 上一次更新书籍 │ new_video.…

教师如何搭建学生查询考试分数的平台?

随着信息技术的快速发展&#xff0c;搭建一个学生查询考试分数的平台已经成为现代教育管理的重要组成部分。这样的平台不仅可以提高成绩管理的效率&#xff0c;还能为学生提供便捷、及时的成绩查询服务。那么&#xff0c;作为教师&#xff0c;我们应该如何搭建这样一个平台呢&a…

2024年华为HCIA-DATACOM新增题库(H12-811)

801、[单选题]178/832、在系统视图下键入什么命令可以切换到用户视图? A quit B souter C system-view D user-view 试题答案&#xff1a;A 试题解析&#xff1a;在系统视图下键入quit命令退出到用户视图。因此答案选A。 802、[单选题]“网络管理员在三层交换机上创建了V…

GPT与R 在生态环境领域数据统计分析

原文链接&#xff1a;GPT与R 在生态环境领域数据统计分析https://mp.weixin.qq.com/s?__bizMzUzNTczMDMxMg&mid2247597092&idx2&sn0a7ac5cf03d37c7b4659f870a7b71a77&chksmfa823dc3cdf5b4d5ee96a928a1b854a44aff222c82b2b7ebb7ca44b27a621edc4c824115babe&…

Java实现Tron(波场)区块链的开发实践(三)波场链水龙头、WEB3测试实战

上一节我们具体讲到Java实现Tron波场链的逻辑代码实现。 这一节我们通过部署和开发好的代码&#xff0c;针对测试链进行自测开发&#xff0c;准备测试环境。 1. 创建离线地址 首先我们需要一个离线地址&#xff0c;我们不需要在线进行创建&#xff0c;直接可以通过第一节的离…

傅立叶之美:深入研究傅里叶分析背后的原理和数学

一、说明 T傅里叶级数及其伴随的推导是数学在现实世界中最迷人的应用之一。我一直主张通过理解数学来理解我们周围的世界。从使用线性代数设计神经网络&#xff0c;从混沌理论理解太阳系&#xff0c;到弦理论理解宇宙的基本组成部分&#xff0c;数学无处不在。 当然&#xff0c…

基于智慧灯杆的智慧城市解决方案(2)

功能规划 智慧照明功能 智慧路灯的基本功能仍然是道路照明, 因此对照明功能的智慧化提升是最基本的一项要求。 对道路照明管理进行智慧化提升, 实施智慧照明, 必然将成为智慧城市中道路照明发展的主要方向之一。 智慧照明是集计算机网络技术、 通信技术、 控制技术、 数据…

计算机网络——计算机网络体系结构

计算机网络——计算机网络体系结构 计算机网络体系结构的由来正确认识分层协议与层次划分著名的几个体系结构OSI体系结构TCP/IP体系结构5层体系结构 我们今天来了解一下计算机网络体系结构&#xff1a; 计算机网络体系结构的由来 俗话说&#xff0c;“没有规矩&#xff0c;不…

STM32/GD32——I2C通信协议

芯片选型 Ciga Device — GD32F470系列 通讯规则 I2C协议&#xff08;或称IIC&#xff09;是由飞利浦&#xff08;现在的恩智浦半导体&#xff09;公司开发的一种通用的总线协议。它使用两根线&#xff08;时钟线和数据线&#xff09;来传输数据&#xff0c;支持多个设备共享…

JavaScript进阶:js的一些学习笔记-原型

文章目录 js面向对象1. 原型2. constructor属性3. 对象原型4. 原型继承5. 原型链 js面向对象 构造函数 属性和方法 function Person(name,age){this.name name;this.age age;this.play ()>{console.log(玩&#xff01;);} } const a new Person(1,12),b new Person(2…

同态滤波算法详解

同态滤波是一种用于增强图像的方法&#xff0c;特别适用于去除图像中的照明不均和阴影。该算法基于照射反射模型&#xff0c;将图像分解为两个分量&#xff1a;照射分量&#xff08;illumination component&#xff09;和反射分量&#xff08;reflection component&#xff09;…

使用Julia语言和R语言实现K-均值

K-均值算法基础 K-均值聚类算法属于一种无监督学习的方法&#xff0c;通过迭代的方式将数据划分为K个不重叠的子集&#xff08;簇&#xff09;&#xff0c;每个子集由其内部数据点的平均值来表示。计算方法大体如下&#xff1a; 1.初始化簇中心 选择K个数据点作为初始的簇中心…

分布式系统互斥性与幂等性问题的分析解决

前言 随着互联网信息技术的飞速发展&#xff0c;数据量不断增大&#xff0c;业务逻辑也日趋复杂&#xff0c;对系统的高并发访问、海量数据处理的场景也越来越多。 如何用较低成本实现系统的高可用、易伸缩、可扩展等目标就显得越发重要。为了解决这一系列问题&#xff0c;系…

2024年最新指南:如何订阅Midjourney(详尽步骤解析)

前言&#xff1a; Midjourney是一个基于人工智能的图像生成工具&#xff0c;它使用高级算法来创建独特和复杂的图像。这个工具能够根据用户输入的文字描述生成对应的图片。Midjourney的特点在于它能够处理非常抽象或者具体的描述&#xff0c;生成高质量、富有创意的视觉内容。M…

高频:spring知识

1、bean的生命周期&#xff1f; 主要阶段 初始化 org.springframework.context.support.ClassPathXmlApplicationContext prepareRefresh 信息: Refreshing org.springframework.context.support.ClassPathXmlApplicationContext67424e82: startup date []; root of context hi…