【Database System Concept 7th】Chapter 24 Advanced Indexing Techniques 读书笔记

Chapter 24 Advanced Indexing Techniques

  • 24.5 Hash Indices
    • 24.5.1 Static Hashing
    • 24.5.2 Dynamic Hashing
      • 24.5.2.1 Data Structure
      • 24.5.2.2 Queries and Updates

24.5 Hash Indices

24.5.1 Static Hashing

这一部分就不介绍了,在14.5中已经介绍过了。

24.5.2 Dynamic Hashing

主要介绍下动态散列的一种方案,称为可扩展散列

24.5.2.1 Data Structure

可扩展散列的基本数据结构如下图所示,主要包括两部分:

  • bucket address table:桶地址表,类似目录,用于存放桶地址
  • bucket:一个一个的桶,用于存放记录

可以注意下图中,桶地址表上方与每个桶的上方都标有一个整数,其中,桶地址表上方的整数 i i i称为全局位深度(grobal depth),每个桶 j j j上方的整数 i j i_j ij称为局部位深度(local depth)。
关于全局位深度 i i i和桶 j j j的局部位深度 i j i_j ij有以下性质:

  • 桶地址表中,指向桶 j j j的表项数为 2 i − i j 2^{i-i_j} 2iij
  • 存放于桶 j j j中的记录,他们搜索码的哈希值二进制 i j i_j ij都一样

这个结构是如何建立出来的、两个位深度分别有什么用处、以及为什么会有以上性质,我们先不管,下一节中会细说,先了解基本概念即可。
在这里插入图片描述

24.5.2.2 Queries and Updates

本节主要介绍可扩展散列的记录查询与插入过程,删除过程暂时还没了解,后续补上。
首先是查询过程,当查询包含某个搜索码Key的记录时,首先使用哈希函数 h h hKey取哈希值 h ( K e y ) h(Key) h(Key),再取出这个哈希值二进制位中的低 i i i(这里的 i i i表示全局位深度),由桶地址表得到对应的桶地址,从而查询到对应的记录。
一个具体的例子如下图所示,假设某条记录的搜索码哈希值为0010,由于全局位深度为2,则对应的表项为00,获取到Bucket 1的地址,从而进入bucket 1查找到对应记录。可以看到,Bucket 1中记录的搜索码对应哈希值的低2位都一致。
在这里插入图片描述

查询过程相对比较简单,接下来我们来看相对复杂的插入记录过程。当插入一条新的记录时,首先同查询过程一致,根据搜索码找到对应的桶 j j j,然后分为以下情况:

  • 若桶 j j j仍有空间,则直接将记录插入该桶
  • 若桶 j j j已满,则需要分裂这个桶并将桶中现有记录加上新纪录重新分配,分为以下两种情况:
    • 如果 i = i j i=i_j i=ij,根据上一节的性质可以知道,桶地址表中只有一个表项指向桶 j j j(让我们假设这个表项为 T E j TE_j TEj),此时需要增加桶地址表的规模,使得桶地址表可以容纳由于桶 j j j分裂产生的两个桶指针。具体的做法是, i i i加1,这将使得桶地址表的容量翻倍,原来的每个表项都产生出自己的一个副本,新的表项包含和原始表项一样的指针(我们令 T E j TE_j TEj的副本表项为 T E k TE_k TEk,则 T E k TE_k TEk也指向 j j j)。然后,系统会分配一个新的桶 k k k,让新表项副本 T E k TE_k TEk指向 k k k,并将 i j i_j ij i k i_k ik都置为 i i i。最后,将 j j j中的所有记录与新记录重新分配,根据记录搜索码哈希值二进制的后 i i i位确定放入桶 j j j中还是放入桶 k k k中。一个具体的例子如下图所示,当在之前的图中插入一条搜索码哈希值二进制为1000的记录时,Bucket 1将溢出,故将Global Depth增大1,增加一个新的桶Bucket 4,并将记录根据二进制后三位重新散列。
    • 在这里插入图片描述
    • 如果 i > i j i>i_j i>ij,那么根据上一节中的性质,桶地址表中不止一个表项指向桶 j j j,会有 2 i − i j 2^{i-i_j} 2iij个表项指向桶 j j j,此时不需要增加桶地址表的容量,直接分裂桶 j j j即可。具体做法是,系统分配一个新的桶 k k k,将指向 j j j 2 i − i j − 1 2^{i-i_j-1} 2iij1个表项修改为指向 k k k,并设置 i j i_j ij i k i_k ik i j + 1 i_j + 1 ij+1,最后重新散列 j j j中的记录与新纪录。一个具体的例子如下图所示,当向Bucket 2插入两个记录之后,再插入一个记录,这时Bucket 2溢出;由于Bucket 2Local Depth小于Global Depth,于是不需增大Global Depth,直接将表项 110 110 110指向的桶修改为新增桶Bucket 5即可,然后重新散列Bucket 2与新纪录。
      在这里插入图片描述
      在这里插入图片描述

以上就是基本的查询操作与插入操作的过程,但插入操作并不是很完善。考虑这样一种情况,假设每个桶的容量为 2 2 2,当我们存在3条记录均包含相同的搜索码时,就会造成桶溢出,此时使用溢出桶方式来解决,即串链表形式,在14.5中已经叙述过,这里就不再赘述了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/183476.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

javascript中的new原理及实现

在js中,我们通过new运算符来创建一个对象,它是一个高频的操作。我们一般只是去用它,而很少关注它是如何实现的,它的工作机制是什么。 1 简介 本文介绍new的功能,用法,补充介绍了不加new也同样创建对象的方…

部署kubevirt教程

前提条件 已安装:kubernetes集群、kubectl、docker apt install -y qemu-kvm libvirt virt-install bridge-utils 【所有节点全部安装】 virt-host-validate qemu部署kubevirt 下载kubevirt-cr.yaml和kubevirt-operator.yaml 先执行: Kubectl apply …

047_第三代软件开发-日志分离

第三代软件开发-日志分离 文章目录 第三代软件开发-日志分离项目介绍日志分离用法 关键字: Qt、 Qml、 log、 日志、 分离 项目介绍 欢迎来到我们的 QML & C 项目!这个项目结合了 QML(Qt Meta-Object Language)和 C 的强…

LLM之幻觉(一):大语言模型幻觉解决方案综述

论文题目:《Cognitive Mirage: A Review of Hallucinations in Large Language Models》 ​论文链接:https://arxiv.org/abs/2309.06794v1 论文代码:https://github.com/hongbinye/cognitive-mirage-hallucinations-in-llms 一、幻觉介绍 …

编写软件产品使用说明书的重要技巧分享

编写软件产品使用说明书是确保用户能够准确了解和使用你的软件的重要一步。一份清晰、详尽的软件产品使用说明书不仅可以提高用户满意度,也能减少用户的疑惑和困惑。然而,要编写一份优秀的软件产品使用说明书并不容易。接下来就跟大家分享一些我的经验和…

《学懂java》:java基础篇

他们都告诉你,必须要做什么,却没告诉你为什么。 ##《 欢迎访问我的网站,ai工具箱,https://4398ai.com里面有免费的chatgpt网站,和很多免费的编程资源的干货》 首先说一下接口,抽象(abstract)&a…

vue实现商品列表,组件抽离

1.需求说明 my-tag 标签组件封装 ​ (1) 双击显示输入框,输入框获取焦点 ​ (2) 失去焦点,隐藏输入框 ​ (3) 回显标签信息 ​ (4) 内容修改,回车 → 修改标签信息 my-table 表格组件封装 ​ (1) 动态传递表格数据渲染 ​ (2) 表头支…

15 款 PDF 编辑器帮助轻松编辑、合并PDF文档

PDF 编辑器在当今的数字环境中至关重要,因为 PDF 已成为共享和存储信息的首选格式。只需几分钟,可靠的 PDF 编辑器即可让用户能够根据其特定需求修改、定制和定制文档。在本文中,我们全面汇编了 15 款最佳免费 PDF 编辑器,让您可以…

Javaweb之HTML,CSS的详细解析

2.4 表格标签 场景:在网页中以表格(行、列)形式整齐展示数据,我们在一些管理类的系统中,会看到数据通常都是以表格的形式呈现出来的,比如:班级表、学生表、课程表、成绩表等等。 标签&#xff…

目标跟踪(DeepSORT)

本文首先将介绍在目标跟踪任务中常用的匈牙利算法(Hungarian Algorithm)和卡尔曼滤波(Kalman Filter),然后介绍经典算法DeepSORT的工作流程以及对相关源码进行解析。 目前主流的目标跟踪算法都是基于Tracking-by-Detec…

YoloV8目标检测与实例分割——目标检测onnx模型推理

一、模型转换 1.onnxruntime ONNX Runtime(ONNX Runtime或ORT)是一个开源的高性能推理引擎,用于部署和运行机器学习模型。它的设计目标是优化执行使用Open Neural Network Exchange(ONNX)格式定义的模型,…

一、Hadoop初始化配置(final+ubuntu保姆级教程)

1、配置虚拟机 三台虚拟机,分别为node1、node2、node3,内存分别为4G、2G、2G,现存最好为(>40G),如下: 2、修改主机名 分别打开三台虚拟机,root用户输入一下命令: no…

Maven3.9.1安装及环境变量配置

一、Maven的下载与安装 maven各版本下载地址 打开链接后自行选择对应版本 下载完成后解压安装,最好别选择c盘,安装目录路径等使用英文,避免产生其他问题 我这里选择的是D盘 二、Maven的环境变量配置 2.1、右键点击此电脑选择属性,点击高级系统设置,点…

win10语言切换调整为像win7一样,设置纯英文键盘切换,使用ctrol+shift切换键盘

文章目录 引入键盘布局说明安装美式键盘去掉微软键盘,修改布局切换快捷键最终效果 引入 我们在玩游戏或者写代码的时候,常常需要使用shift键,而输入法的shift键常常是中英切换按键,这就让人非常不爽了,这里仿照在win7…

信息科技风险管理:合规管理、技术防控与数字化

信息科技对金融业务发展所起的作用是举足轻重的。近年来,金融机构在战略规划中相继引入科技引领的概念。作为金融机构信息科技从业人员,我们笃信信息科技是一个非常有用的工具,一个兼具产品思维和管理思维、拥有高质增效能力的工具。 这个工…

服务器的操作系统,你选择哪些?

OpenCloudOS CentOS CentOS Stream Ubuntu Debian Windows Server

接口测试工具

接口测试的重要性 接口测试: 直接对后端服务的测试,是服务端性能测试的基础,是测试工程师的必备技能。 接口测试的概念 接口:系统之间数据交互的通道 接口测试:校验接口响应数据与预期数据是否一致 接口信息解析 …

一款好用的PDF转翻页电子书网站

​你是否曾经遇到过PDF文件无法翻页或者阅读不便的问题?今天给大家推荐一款好用的PDF转翻页电子书网站,让你轻松阅读PDF文件,不再烦恼翻页问题! 一、网站介绍 这款FLBOOK在线制作电子杂志网站支持多种电子文件格式转换&#xff0…

Nginx配置

localtion规则解释 #表示精确匹配,优先级也是最高的 ^~ #表示uri以某个常规字符串开头,理解为匹配url路径即可 ~ #表示区分大小写的正则匹配 ~* #表示不区分大小写的正则匹配 !~ #表示区分大小写不匹配的正则 !~* #表示不区分大小写不匹配的正则 / #通用匹配&#…

oracle_19c 安装

oracle安装部署 1、安装docker,docker-compose环境。 curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun curl -L "https://github.com/docker/compose/releases/download/1.14.0-rc2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/b…