【算法 高级数据结构】树状数组:一种高效的数据结构(一)

🚀个人主页:为梦而生~ 关注我一起学习吧!
💡专栏:算法题、 基础算法~赶紧来学算法吧
💡往期推荐
【算法基础 & 数学】快速幂求逆元(逆元、扩展欧几里得定理、小费马定理)
【算法基础】深搜


文章目录

  • 1 引言
    • 1.1 树状数组的概念
    • 1.2 树状数组的应用场景
  • 2 基础知识
    • 2.1 二进制索引的概念和性质
    • 2.2 前缀和的概念和计算
  • 3 树状数组的定义和数学推导
    • 3.1 通俗易懂的解释什么是树状数组※
    • 3.2 树状数组的数学推导※


1 引言

1.1 树状数组的概念

树状数组(Binary Indexed Tree,BIT)是一种数据结构,用于高效地处理数组的动态查询和更新操作。它可以在O(log n)的时间复杂度内完成单点更新和前缀和查询操作。树状数组常用于解决数组频繁更新和查询前缀和的问题,比如求解逆序对、区间和等。

在这里插入图片描述

1.2 树状数组的应用场景

  1. 动态查询问题:树状数组非常适用于需要动态查询某个区间内元素和的场景。
  2. 频繁更新问题:树状数组也适用于频繁更新数组元素的情况。
  3. 逆序对问题:逆序对问题是一个常见问题,即找出数组中所有满足i<ja[i]>a[j](i, j)对。树状数组可以在O(nlogn)的时间复杂度内解决这个问题。

2 基础知识

2.1 二进制索引的概念和性质

二进制索引,也称为树状数组或有限差分数组,是一种特殊的数据结构,用于高效地处理数组中的前缀和查询。它的核心思想是利用二进制表示中的每一位来快速计算前缀和,从而实现高效的查询和更新操作。

在这里插入图片描述

概念

二进制索引的主要概念是基于数组元素的二进制表示来构建索引。具体来说,对于数组中的每个元素,我们可以将其下标转换为二进制形式,并根据二进制位来构建索引。通过维护这些索引,我们可以快速计算数组的前缀和,从而实现高效的查询和更新操作。

性质

  • 前缀和查询的高效性:二进制索引可以在O(log n)的时间复杂度内计算数组的前缀和。这是因为它利用了二进制表示的特性,通过跳跃式地计算不同位上的前缀和,实现了快速查询。
  • 单点更新的高效性:与前缀和查询一样,二进制索引也可以在O(log n)的时间复杂度内完成单点更新操作。当数组中的某个元素发生变化时,只需要更新对应的索引,即可快速反映到前缀和上。
  • 空间效率:二进制索引的空间复杂度与原始数组相同,即O(n)。它不需要额外的存储空间来维护索引结构,因此具有较高的空间效率。

2.2 前缀和的概念和计算

前缀和(Prefix Sum)是一个数组的概念,指的是数组中从第一个元素开始到某个位置元素(包括该位置元素)的总和。前缀和通常用于快速计算某个区间的和,避免了对每个元素进行逐一相加的操作,从而提高计算效率。

计算前缀和的方法很简单,通常是通过迭代数组中的每个元素,并将当前元素与前一个元素的前缀和相加,得到当前元素的前缀和。第一个元素的前缀和就是它本身。

例如,给定一个数组 arr = [1, 2, 3, 4, 5],它的前缀和数组 prefix_sum 可以这样计算:

prefix_sum[0] = arr[0] = 1  
prefix_sum[1] = arr[0] + arr[1] = 1 + 2 = 3  
prefix_sum[2] = arr[0] + arr[1] + arr[2] = 1 + 2 + 3 = 6  
prefix_sum[3] = arr[0] + arr[1] + arr[2] + arr[3] = 1 + 2 + 3 + 4 = 10  
prefix_sum[4] = arr[0] + arr[1] + arr[2] + arr[3] + arr[4] = 1 + 2 + 3 + 4 + 5 = 15

所以,前缀和数组 prefix_sum 为 [1, 3, 6, 10, 15]。


3 树状数组的定义和数学推导

3.1 通俗易懂的解释什么是树状数组※

在这里插入图片描述

对于一个数组,我们通常需要这样的操作:

  1. 修改某个元素的值
  2. 求一段区间的和

如果用朴素的做法,我们通常需要开一个数组,保存下来所有元素,每查询一次,遍历一次数组

但这会使得求和操作的时间复杂度达到 O ( n ) O(n) O(n),但如果数据量和查询次数达到上百万,这样的效率太低了

  • 但有人可能会想到,把数组中的元素两两求和,保存到另一个数组中:
    在这里插入图片描述

这样我们在计算的时候就会节省一半的时间,修改数据的时候也就是多改一个数字而已,但是对于很大的数据量,还是很慢。

  • 那我们可以再将这一层元素两两求和,往上叠加一层,直到只剩一个元素为止:
    在这里插入图片描述

这样即使要求和的数字很多,我们也可以利用这些额外的数组计算出需要的答案(用空间换时间的思想)

例如:要计算前14个数字的和
在这里插入图片描述
只需要计算这样4个数字就行
在这里插入图片描述

即使要计算前一百万个数字的和,我们也只需要进行10~20次加法

这样将查询的时间复杂度降到了 O ( log ⁡ n ) O(\log n) O(logn),效率提升了很多

观察这个数组我们可以发现,数组中的某些数字是不会用到的,大家可以手动模拟一下,所有层的第偶数个数字在计算时都不会被用到,都有更好的方案来替代
在这里插入图片描述

去除掉不会被用到的数字之后,剩下的数字正好是 n n n个,这与数组的长度是一样的

所以,我们可以用一个与原数组长度相同的数组来装下这些数,这个数组就是一颗树状数组,数组中的每一个元素都对应下面的每一个区间,这些区间表示的都是每个对应的区间和
在这里插入图片描述
求和时,我们只需要找到对应的区间,将这些区间相加即可找到答案

修改某个数据时,我们也只需要向上找到包含它的所有区间修改即可

所有查询以及修改元素的操作,都可以在 O ( log ⁡ n ) O(\log n) O(logn)的时间复杂度内完成

3.2 树状数组的数学推导※

对于一个数 x x x,我们可以把它分解成二进制的形式:
2 i k + 2 i k − 1 + 2 i k − 2 + . . . + 2 i 1 2^{i_{k}}+2^{i_{k-1}} + 2^{i_{k-2}} + ... + 2^{i_{1}} 2ik+2ik1+2ik2+...+2i1其中, 2 i k 2^{i_k} 2ik表示 x x x的最高二进制位, 2 i 1 2^{i_{1}} 2i1表示最低二进制位 i k ≥ i k − 1 ≥ . . . ≥ i 1 ( k ≤ log ⁡ x ) i_{k} \geq i_{k-1} \geq ... \geq i_{1} (k \leq \log x) ikik1...i1(klogx)

假设我们要求 1 − x 1-x 1x的和,我们可以把区间分成 k k k个区间

( x − 2 i 1 , x ] (x-2^{i_1},x] (x2i1,x]
( x − 2 i 1 − 2 i 2 , x − 2 i 1 ] (x-2^{i_1}-2^{i_2},x-2^{i_1}] (x2i12i2,x2i1]
. . . ... ...
( 0 , x − 2 i 1 − 2 i 2 − . . . − 2 i k − 1 ] (0,x-2^{i_1}-2^{i_2}-...-2^{i_{k-1}}] (0,x2i12i2...2ik1]

这样我们把 x x x分成了 log ⁡ x \log x logx个区间,如果我们把所有区间的和都预处理出来,最多只需要加 log ⁡ x \log x logx次就可以将区间和算出来

如何预处理这些数呢?

我们看一下这些区间有什么性质:

  • 首先,每个区间都包含 2 i 2^i 2i个数
  • 每个区间 ( L , R ] (L,R] (L,R]的长度一定是 R R R的二进制表示的最后一位 1 1 1所对应的次幂

所以,利用lowbit函数,我们可以把贝格区间简化为 ( R − l o w b i t ( R ) + 1 , R ] (R-lowbit(R)+1,R] (Rlowbit(R)+1,R](该函数的定义如下)

def lowbit(x):return x & -x

于是,我们如果想用数组来记录区间和,可以用c[R]来表示区间和:c[x] = a[x - lowbit(x) + 1, x]

下面来看一下c[x]之间的关系:

在这里插入图片描述

经过这样的数学推导之后,我们得到了与上面介绍中一致的形式

下面来介绍一下如何计算的数学推导

  • 给出x,如何找到x的所有子节点

假设 x > 0 x > 0 x>0,则必然存在最后一位 1 1 1,假设这一位 1 1 1后面有 k k k 0 0 0,我们让 x − 1 x-1 x1,则后面有连续的 k k k 1 1 1,这每个 1 1 1都对应一个儿子,我们找每个儿子只需要每次减去最后一位 1 1 1,一直减 k k k次,直到变成 0 0 0

二进制表示解释如下:

c[x] ~ (x - lowbit(x) + 1, x]
x - 1 ~ ...1000(k个0)
儿子区间1 : (...0111, ...0110]
儿子区间2 : (...0110, ...0100]
儿子区间3 : (...0100, ...0000]
  • 如何通过子节点找父节点?

这个与找儿子结点是相反的,是一个迭代的过程,通常用于修改结点

假设给定一个x,修改完a[x]之后要修改哪些区间和?

假设 p p p是一个父节点,它的二进制表示要满足要找子节点之前的形式(最后一位1后面跟着若干个0),那么它的子节点一定满足那个1变成0,后面跟若干个1,后面是若干个0

我们只需要把上面的过程逆过来就可以了

每次加上一个lowbit(x),就找到直接父节点,然后一直往上加,直到加到那个父节点的位置是1,一共加 log ⁡ x \log x logx次,就可以找到所有父节点

对于一个要修改的a[x],修改操作的代码是:

for(int i = x; i <= n; i += lowbit(i)) tr[i] += c;

要想明白的是:为什么改完x之后,只需要更新tr数组的最多这么logx个位置(结合上面的黑白图)

查询(1~x的区间和)操作的代码(找子区间):

for(int i = x; i; i -= lowbit(x)) res += tr[i];

部分内容及灵感来源:
https://www.bilibili.com/video/BV1ce411u7qP/
https://www.acwing.com/file_system/file/content/whole/index/content/172493/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/271546.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

排序算法:插入排序和希尔排序

一、插入排序 1.基本原理 插入排序&#xff08;英语&#xff1a;Insertion Sort&#xff09;是一种简单直观的排序算法。它的工作原理是通过构建有序序列&#xff0c;对于未排序数据&#xff0c;在已排序序列中从后向前扫描&#xff0c;找到相应位置并插入。插入排序在实现上…

重读 Java 设计模式: 探索经典之道与 Spring 框架的设计

写在开头 记得大学刚毕业那会儿&#xff0c;想学点东西&#xff0c;于是拿出了《Head First 设计模式》这本书&#xff0c;就开始了阅读&#xff0c;我曾对这些模式感到晦涩难懂。然而&#xff0c;随着工作岁月的增长&#xff0c;我逐渐领悟到设计模式的价值&#xff0c;尤其是…

类和对象(4)

文章目录 1. const成员2.取地址及const取地址操作符重载3. 再谈构造函数3.1构造函数体赋值3.2初始化列表 1. const成员 将const修饰的成员函数称为const成员函数。 const修饰类成员函数&#xff0c;实际修饰该成员函数的隐含地this指针&#xff0c;表明在该成员函数中不能对类…

【echarts】xAxis鼠标事件失效问题

项目中用到echarts柱状图&#xff0c;出现x轴标签文字过长重叠问题&#xff0c;在pass掉标签倾斜、换行方案之后最终决定限制文字长度&#xff0c;超出以…占位&#xff0c;鼠标悬浮时显示完整tooltip。 但编写过程中发现xAxis鼠标事件无法触发&#xff0c;只有bar区域是可触发…

【C++杂货铺】详解string

目录 &#x1f308;前言&#x1f308; &#x1f4c1; 为什么学习string &#x1f4c1; 认识string&#xff08;了解&#xff09; &#x1f4c1; string的常用接口 &#x1f4c2; 构造函数 &#x1f4c2; string类对象的容量操作 &#x1f4c2; string类对象的访问以及遍历操…

【uni-app】condition 启动模式配置,生产环境无效,仅开发期间生效

在小程序开发过程中&#xff0c;每次代码修改后&#xff0c;都会启动到首页&#xff0c;有时非常不方便&#xff0c;为了更高效的开发&#xff0c;有时需要模拟直接跳转到指定的页面&#xff0c; 操作方法如下&#xff1a; 在pages.joson里面配置下列代码&#xff1a; "…

解决 matplotlib 中文显示乱码的问题

matplotlib 库默认只显示中文 例如&#xff1a; import matplotlib.pyplot as pltimg plt.imread(test.jpg)# plt.rcParams[font.sans-serif] [SimHei] # 用来正常显示中文标签 # plt.rcParams[axes.unicode_minus] False # 用来正常显示负号 #有中文出现的情况&#xf…

宏auto关键字(C++基础)

宏 宏可以实现对语句的同义替换&#xff0c;简单来说就是预处理阶段、编译前的替换&#xff08;包括符号&#xff0c;变量等&#xff09;。 #define LOG(x) std::cout << x << std::endl; LOG("hello") 可以正常使用。 下面通过上图中借用不同开发模…

YOLOv8改进 | 独家创新篇 | 利用DCNv3集合DLKA形成全新的注意力机制(全网独家创新)

一、本文介绍 本文给大家带来的机制是由我独家创新结合Deformable Large Kernel Attention (D-LKA) 注意力机制和DCNv3可变形卷积的全新注意力机制模块(算是二次创新),D-LKA的基本原理是结合了大卷积核和可变形卷积的注意力机制,通过采用大卷积核来模拟类似自我关注的感受…

MySQL学习笔记(一)数据库事务隔离级别与多版本并发控制(MVCC)

一、数据库事务隔离级别 数据库事务的隔离级别有4种&#xff0c;由低到高分别为Read uncommitted &#xff08;读未提交&#xff09;、Read committed&#xff08;读提交&#xff09; 、Repeatable read&#xff08;可重复读&#xff09; 、Serializable &#xff08;串行化&a…

OpenAI劲敌吹新风! Claude 3正式发布,Claude3使用指南

Claude 3是什么&#xff1f; 是Anthropic 实验室近期推出的 Claude 3 大规模语言模型&#xff08;Large Language Model&#xff0c;LLM&#xff09;系列&#xff0c;代表了人工智能技术的一个显著飞跃。 该系列包括三个不同定位的子模型&#xff1a;Claude 3 Haiku、Claude 3…

06 - ip route和route -n的区别

1 ip route和route -n的区别 ip route 和 route -n 都是用于查看和管理Linux系统路由表的命令。但下面是它们的区别&#xff1a; ip route&#xff1a;是Linux系统中的现代工具&#xff0c;它属于iproute2套件&#xff1b;它提供了更多的选项&#xff0c;可以更精确地控制路由表…

弱电综合布线:连接现代生活的纽带

在当今信息化快速发展的时代&#xff0c;弱电网络布线作为信息传输的重要基础设施&#xff0c;其作用日益凸显。它不仅保障了数据的高效流通&#xff0c;还确保了通信的稳定性。从商业大厦到教育机构&#xff0c;从政府机关到医院急救中心&#xff0c;再到我们居住的社区&#…

EIP-1559

EIP EIP是以太坊改进提案&#xff08;Ethereum Improvement Proposal&#xff09;的缩写。它是一种标准化的提案制度&#xff0c;用于描述和讨论对以太坊区块链网络的改进和升级。EIP的目的是提供一个开放的、透明的过程&#xff0c;让社区成员、开发者和其他利益相关者能够共同…

短视频矩阵系统----矩阵系统源码搭建(技术门槛?)

短视频矩阵是什么意思&#xff1f;短视频矩阵的含义可以理解为全方位的短视频账号&#xff0c;通过不同的账号实现全方位的品牌展示。实际上是指一个短视频账号&#xff0c;通过不同的链接实现品牌展示&#xff0c;在不同的粉丝流量账号中互相转发同一个品牌&#xff0c;在主账…

pytorch CV入门3-预训练模型与迁移学习.md

专栏链接&#xff1a;https://blog.csdn.net/qq_33345365/category_12578430.html 初次编辑&#xff1a;2024/3/7&#xff1b;最后编辑&#xff1a;2024/3/8 参考网站-微软教程&#xff1a;https://learn.microsoft.com/en-us/training/modules/intro-computer-vision-pytorc…

外包干了8天,技术退步明显。。。。。

先说一下自己的情况&#xff0c;本科生&#xff0c;19年通过校招进入杭州某软件公司&#xff0c;干了接近3年的功能测试&#xff0c;今年年初&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试…

能源大数据采集,为您提供专业数据采集服务

随着经济的不断发展&#xff0c;能源产业也逐渐成为国民经济的支柱产业之一。而对于能源行业来说&#xff0c;数据采集是一项至关重要的工作。以往&#xff0c;能源企业采集数据主要依靠人工收集、整理&#xff0c;但是这种方式不仅效率低下&#xff0c;而且容易出现数据不准确…

Python测试框架Pytest的基础入门

Pytest简介 Pytest is a mature full-featured Python testing tool that helps you write better programs.The pytest framework makes it easy to write small tests, yet scales to support complex functional testing for applications and libraries. 通过官方网站介绍…

SpringBoot 手写 Starter

1.介绍 SpringBoot中的starter是一种非常重要的机制&#xff0c;能够抛弃以前繁杂的配置&#xff0c;将其统一集成进starter&#xff0c;应用者只需要在maven中引入starter依赖&#xff0c;SpringBoot就能自动扫描到要加载的信息并启动相应的默认配置。starter让我们摆脱了各种…