Linux--磁盘与文件系统

目录

1.什么是文件系统

2.磁盘

2.1什么时磁盘

2.2磁盘的物理存储结构

2.3磁盘的逻辑抽象结构

3.磁盘文件系统(EXT2)

inode Table(i结点表)

Data Block

inode Bitmap(inode位图)

Block Bitmap(块位图)

在Linux如何删除文件

Group Descriptor Table (GDT)

超级块(Super Block)

文件系统如何对分区进行管理

理解文件系统中的目录

如何在磁盘中确定分区


1.什么是文件系统

这里我们知道打开文件就是将文件加载到内存中,我们知道在我们使用的计算机中,内存要远远小于外设的,也因此在操作系统中打开的文件可能是计算机文件的1%或0.1%等。

这里我们知道在操作系统中我们会对打开的文件进行先描述,再组织创建内核数据结构管理起来。那在外存中的那些未打开的文件又是怎么样的呢?

那些未被打开的文件在外设中也是按照一定的规则被管理着的(方便用户即时,快速的打开文件),这也是为什么你在使用打开文件时,只需要用fopen提供路径就可以快速打开文件的原因。

这里我们可以举快递站的例子:

快递站每天都会收到很多快递,这里只有极少数的快递会被拿走(被打开的文件),绝大多数快递会被滞留在快递站里(未被打开的文件)。如果我们不对滞留的快递做管理,会使快递堆积成山。这时当人来拿快递时(打开文件),就会花费很长的时间还不一定能找的到。

这里我们把管理打开的文件与未被打开的文件的过程,叫做文件系统

2.磁盘

2.1什么时磁盘

磁盘是---硬件---物理存储设备,它由于容量大,价格便宜被企业大量使用。

磁盘:主要由磁头与盘面组成。

有多个盘面,盘面的上下两面都可以记录数据。每个面都对应的有一个磁头。

磁盘的盘面可以被读写。

磁头开以左右移动,盘面可以逆时针或顺时针高速旋转(旋转速度很快),通过这样可以定位到盘面上的任意位置。

因此磁盘的读写是机械运动,注定了磁盘是非常慢的。这也是为什么在执行可执行文件时,要把可执行文件预先放到内存中的原因。

注:磁盘里的磁头与磁面没有挨着,只是离得非常近。

2.2磁盘的物理存储结构

磁盘盘面虽然表面光滑,但是由一圈一圈的同心环组成的。这一圈的环,我们叫做磁道。磁道之间也是有一定的距离的。

一个磁道被两条半径所组成的区域,我们叫做扇面(图中红色部分),

这里我们可以知道:

一个盘面可以有很多同心磁道组成

一圈磁道可以有很多的扇区组成

扇区是磁盘在访问时的最小存储单元---一般是512字节

注:如果你想读或写磁道上的数据时,必须把数据所在的扇区全部加载到内存中。也正是因此磁盘也被叫做块设备

每一个磁道所存储的数据大小是一样的,因此里圆心越近的磁道,数据密集程度越密,越远数据越疏。

如何向一个扇区写入数据,我们该如何寻址(定位)?

1.选择那一面---本质是选择那一个磁头

2.选择该面上的哪一个磁道(也叫柱面)

3.选择该磁道的哪一个扇区

这里我们把这种方法叫做CHS定位法(C--cylinder(柱面)。  H--Head(磁头)  S--sector(扇区))

2.3磁盘的逻辑抽象结构

这里我们先那磁带举例说明:

相信大家小时候都玩过磁带里的磁条,我们可以将它拿出来拉成一条直线。这里我们可以类比,将磁盘的盘片想象成为线性空间。

那么整个磁盘可以看作一个sector arr[n]的数组,这样对磁盘数据的管理就变成了对数组的管理,只要知道数组的下标,我们就可以通过计算,算出数据是在那个磁头,磁道与扇区上,通过CHS定位法在磁盘上找到。

对于操作系统,可以按照扇区为单位进行存取,也可以基于文件系统,按照文件块为单位进行数据存取(以8个扇区[4KB]为基本单位--文件块)。做LBA(Logical Block Address).这里LBA也是数组下标,因此我们也可以通过计算与CHS法,完成对磁盘数据的读写,不同的是LBA一次操作8个扇区。

因此:对于存储设备的管理,OS层面,就转换成为了对数组的增删改查!!!

3.磁盘文件系统(EXT2)

这里我们知道磁盘的内存是比较大的,例如一块500GB的磁盘,我们对磁盘中文件的管理也就是对这500GB空间的管理。这里如果直接对这500GB的空间管理,难度太大,也不利于我们用户的使用。因此对于磁盘的管理,我们采用了分治的策略,将500GB的空间分成5个100GB进行管理,

每个100GB又划分成多个2GB进行管理。这样我们就可以先把这2GB的空间管理好,然后再把成功的管理方法在其他的区域照搬实行。

这里我们把将500G划分成100G的动作叫做分区。(这里对于我们平常使用的笔记本电脑,只有一块磁盘,而我们在电脑上看到的C盘D盘等其实就是把一大块的磁盘分区后,给每个区取的名字)。

那么我们又是如何管理好每一个分区的呢?

这里我们还是觉得100GB的空间有一点大,因此这里我们还继续划分。将100GB划分为一个2GB空间的一个goup(组)。因此对于磁盘的管理我们就简化为了对于这一个组2GB的管理,只要我们把这2GB的空间管理好,其他组就可以照搬管理了。

思想如图:

那么又是如何管理这2GB的空间的呢?

这里Linux系统采用了这样的方法:

我们把每一个分区划分成一个一个的块组(2GB的空间,Block group),这样我们对于2GB的空间管理就变成了对块组进行管理,而在块组中又有如下部分。

Boot Block :我们叫做启动块。一般启动块会在整个磁盘中编号为0的磁头,编号为0的盘面,编号为0的磁道的第一个扇区,与计算机启动有关。

这里要想解释后面的五个我们要先补充一些知识:

一,我们要知道,磁盘存储文件本质是:存储文件信息(文件内容+属性),文件管理的数据。这些对于磁盘来说都是数据,在Linux中采用了内容与属性分开存储。 同时Linux规定在在使用磁盘分区时,先要让管理数据写入块组中,这个工作我们叫做格式化。

在Linux中找到一个有文件的目录

然后使用两个指令:

ll  与  ls -li

这里我们发现在使用ls -li指令时,多出来了一部分数字,在Linux中我们把他们叫做 inode编号,一般情况下一个文件只有一个inode编号,基本上每一个文件都必须有。inode编号在一个分区里具有唯一性。Linux内核中,识别文件,和文件名无关,只和inode有关。

接下来先解释就开始解释。

inode Table(i结点表)

存放文件属性 如 文件大小,所有者,最近修改时间等.

这里我们要知道,文件属性的种类与大小时确定的,不会发生变化。因此在磁盘中保存文件属性是通过创建一个inode结构体保存。也就是说一个inode对象里就存储着一个文件的属性。

struct inode
{//文件大小//权限//拥有者//所属组//inode编号// ...   
}

在Linux中这个结构体的大小是固定的:128字节。

因此正如其名一样,inode Table中存储着很多个inode。当我们知道inode Table的大小时,我们就可以计算出inode Table中最多可以存放多少个文件。,并且inode在表中的位置就是在块组中的inode编号,因此在表中也很容易找到inode在表中的位置:inode编号*128。所以inode Table 可以看成struc inode inode_table[n](struct inode为元素的一个数组)。 

这里可能有人会问,如果像上面那样,在一个分区里inode编号不是就有可能重复了吗?

这里其实是这样的:

在Linux系统中,会在每一个块组的最前面加上一个start_inode_number。块组里的inode编号+start_inode_number就是使在一个分区里的每一个inode编号不同。这也是最终在分区上的inode编号。如果你想知道你在inode Table表中的位置也很简单,只需要拿着我们最终使用的inode编号 - 对应的start_inode_number,就可以知道inode是表中的第几个。

Data Block

:数据区,存放文件内容

从上面我们知道文件的属性与内容是分别存储的,属性存在inode Table中,而Data Block就是用来存数据的。

它里面是以4KB为单位的数据块区域

这里的每一个数据块都保存的是整个块组里所有文件的内容数据。为了便于找到对应的数据,每一个数据块也都应该有一个编号。

为了我们方便找到一个文件对应的数据块,因此struct inode里有一个数组 int blocks[N] (N一般是15)。这个数组记录的是文件内容在Data Block里对应的数据块的块号。如:当一个文件的内容被放在了1,2,4这三个数据块中。那么文件对应的inode结构体里的block数组中记录的值就是1,2,4。

这里可能有人会问,如果这样那么一个文件内容大小最多只能是15*4KB,那写几个GB的文件又是怎么来的呢?

这里我们要说block数组采用了这样的策略,前13个元素是直接映射,第14个采用二级映射,第15个采用三级映射。

直接映射:block数组记录的数据块直接存储文件数据。空间大小:13*4KB

二级映射:block数组记录的数据块存储的是数据块号,再接着找到的数据块才存储数据。空间大小:4KB/4*4KB。

三级映射:block数组记录的数据块存储的是数据块号,再接着找到的数据块还是存储的数据块号号,再找到的数据块才是存储的数据。空间大小:4KB/4*4KB/4*4KB。

如果块组中的数据块全部用完还是还没存储完文件数据,那么可以同一分区里其他块组的数据块:块组中记录其他分区的区号与所用的数据块。(注:可以跨块组使用数据块,但不能跨分区)

了解到这里,未来当我们需要读取一个文件时,我们只需要知道这个文件的inode,就可以获取文件的各种属性,再通过inode里的block数组里的内容,到Data Block里找到对应编号的数据块,就可以将数据库的内容导入到内存中,就获取文件内容。同时这样文件的属性与内容就关联了起来。

那么我们又怎么找到这个文件的inode呢?其实最终还是落到了找到这个文件的inode编号上(在整个分区上具有唯一性)。

所以当我们找到inode编号,先减去start_inode_number,定位是在那个块组里,然后再在inode Table找到inode,找到文件属性,通过bloc数组内容,在Data Block中找到文件内容,最后将文件的属性与内容加载到内存中,就从磁盘中读取出来。

inode Bitmap(inode位图)

: 通过位图,用一个bit来表示inode是否空闲可用。

这里我们知道当我们创建一个文件时,我们就要在inode表里给它分配一个inode,那么我们如何知道表里面那个inode不可用,那个可以用呢?这里就是用位图来解决的。

这里我们用位图中bit的个数来表示inode Table最多又几个inode,用0来表示该inode可以使用,用1表示该inode不可以使用。

通过遍历这个位图,知道那写inode不可以使用,那些可以使用。然后通过合适的算法,分配一个该创建的文件。因此inode Bitmap管理着inode Table.

Block Bitmap(块位图)

Block Bitmap中记录着Data Block中哪个数据块已经被占用,哪个数据块没有被占用

这里同inode Bitmap相同,用位图来管理标记数据块的使用情况。

在创建文件时,遍历Block Bitmap,用合适的算法分配合适的数据块给文件存储数据。Block Bitmap管理着Data Block

因此从我们可以得知: inode Table与Data Block存储着文件信息,inode Bitmap与Block Bitmap存储着因管理文件而产生的数据。

在Linux如何删除文件

根据文件inode编号找到inode结构体,获取block数组里的数据,将Block Bitmap中对应的对应的bit位置为0。用相同的方法可以将inode Bitmap中对应的bit位置为0。(因为在inode BItmap与Block Bitmap中0表示inode与数据块为空,可用。当其再次使用时,只需将新文件的属性与内容覆盖即可)

因此删除文件只是消除管理文件的数据,并不会立即就删除文件的属性与内容。

同时这也是我们为什么能进行数据恢复的原因:

在Linux系统中有一个日志文件,可以记录被删除文件的inode编号,这样我们就可以得知其用了那个inode与数据块。然后将其在inode Bitmap与Block Bitmap中对应的bit位置为1。(要在这个inode编号再次被利用前进行数据恢复,因为一旦被再次利用,被删除文件的属性内容就会被覆盖)

同时根据创建与删除文件的过程我们也可以知道,为什么下载文件要远远慢于删除文件:

下载文件要分配inode查找可用的inode与数据库,再把文件的属性与内容拷贝到上面。

删除文件,只需用inode找到其对应在inode Bitmap与Block Bitmap中的bit位置为0即可。

Group Descriptor Table (GDT)

:块组描述符,描述块组属性信息(使用情况)

主要记录了有多少个inode,多少个inode被使用。有多少个数据块,多少个数据块被使用了等块组信息,用来衡量整个块组的使用情况。

超级块(Super Block

:存放文件系统本身的结构信息。记录的信息主要有: block inode 的总量,未使用的block inode 的数量,一个 block inode 的大小,最近一次挂载的时间,最近一次写入数据的 时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block 的信息被破坏,可以说整个 文件系统结构就被破坏了

注:Super Block不属于块组。可能只有几个块组有,不是每个一个都有的。

为什么Super Block不想GDT一样每一个块组都有或是只有一个,而是在几个块组才有?

这里我们知道GDT是用来存储一个块组的信息,Super Block是用来存储一个分区的信息。

首先GDT管理的空间较小,如何一个GDT挂掉,对于计算机整体而言影响并不是很大。而Super Block 管理的空间很大,如果只有一个,它挂掉了,就会导致电脑中这个盘无法使用。如果是C盘的挂掉了,就是导致这台电脑无法使用。因此为了防止,才在一个分区用多个Super Block。同时每一个分区只需要一个就行了,如果每一个块组都有一个,就会有很大的冗余,浪费空间。

   

文件系统如何对分区进行管理

这里还是根据操作系统的六字真言:先描述,再组织。

在内核里会维护一张文件系统列表(一个结构体对象):它使用来存储每一个分区的Super Block。因此在操作系统软件上对整个磁盘的管理就变成了对几个Super Block的管理 

文件系统只用inode编号来找到文件对其进行操作的,但是用户使用时一直用的都是文件名。

因此在系统中文件名要与inode有一个映射关系。

那这个映射关系又是如何做到的呢?这里我们就要先理解一下目录。

理解文件系统中的目录

 首先目录也是一个文件,因此目录有自己的inode与数据块,也是有它的属性与内容。这里目录的属性与普通文件一样。而目录的数据块中存储着文件名与该文件inode的映射关系(每个文件名对应的inode)。

这也解释了为什么一个目录下不 能出现同名文件,因为一个文件名只有一个inode。 

同时也解释了为什么我们可以通过一个文件名就可以找到磁盘中的文件:我们可以在文件所在目录在目录的数据块找到文件名对应的inode编号,就可以找到文件,将文件导入内存。

在Linux中在一个目录下,新建,删除,修改一个文件对于这个目录我需要什么权限呢? 当然是w权限。

那么今天我们知道,这里的新建,删除,修改本质是修改目录文件的数据块内容,就是对文件进行修改,因此需要w权限。

如何在磁盘中确定分区

这里我们所说的文件系统内容都是在一个分区里进行的,但是我们知道在磁盘中,是要先确定分区的,那么在Linux中又是如何做到的呢?

Linux中是通过挂载,使用指令

 sudo mount /dev/sdb1 (分区)/mnt(目录)

将一个目录(我们常用的C盘,D盘等)与分区关连起来,可以通过路径的前缀得知是在那个分区的。

因此在我们系统获得一个路径时,先通过路径前缀,确定在那个分区,然后再在前缀目录的数据块里找到下一级目录对应的inode,然后按照这个方法遍历路径到底, 在磁盘中找到文件对应的inode,然后将用文件的属性与内容加载到内存中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/241471.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++类相关oj题目分享(计算日期到天数转换、日期差值、打印日期、日期累加)

文章目录 1.计算日期到天数转换题目详情代码思路 2.KY111 日期差值题目详情代码思路 3.KY222 打印日期题目详情代码 4.KY258 日期累加题目详情代码思路 1.计算日期到天数转换 传送门 题目详情 代码 #include <iostream> using namespace std; int GetDay(int year,int…

【创作活动】ChatGPT 和文心一言哪个更好用?

文章目录 文心一言优点缺点 ChatGPT优点缺点 Java编码能力比较对人工智能的看法 ChatGPT是由OpenAI开发的交互式AI大模型&#xff0c; 文心一言是由百度研发的知识增强大语言模型&#xff0c;本文从Java开发的角度对比一下哪个更好用&#xff08;本文仅用于投稿CSDN创造活动&am…

虚拟线程探索与实践

优质博文&#xff1a;IT-BLOG-CN 一、简介 虚拟线程是轻量级线程&#xff0c;极大地减少了编写、维护和观察高吞吐量并发应用的工作量。虚拟线程是由JEP 425提出的预览功能&#xff0c;并在JDK 19中发布&#xff0c;JDK 21中最终确定虚拟线程&#xff0c;以下是根据开发者反馈…

中小企业股权质押融资(下)

股权质押融资的主要风险 由于股权资产的特殊性&#xff0c;较固定资产抵押和质押、第三方担保等方式&#xff0c;股权质押融资风险易受企业经营状况等因素的影响&#xff0c;主要包括股权价值下跌的风险、股权质押的道德风险、股权处置风险以及现行法律不完善导致的法律风险。…

30分钟带你深入优化安卓Bitmap大图

30分钟带你源码深入了解Bitmap以及优化安卓大图 一、前言二、Bitmap入门1. 如何创建Bitmap?2. Bitmap的堆内存分布在哪里3. 图片文件越大&#xff0c;Bitmap堆内存会越大吗&#xff1f;4. 如何管理Bitmap的内存&#xff1f;5. 实战修改Bitmap的堆内存&#xff0c;改变图片的图…

一万六千字大章:Chrome 浏览器插件 V3 版本 Manifest.json 文件全字段解析

Chrome 浏览器插件 V3 版本 Manifest.json 文件全字段解析 Manifest.json 文件格式 每个扩展程序的根目录中都必须有一个 manifest.json 文件&#xff0c;其中列出了有关该扩展程序的结构和行为的重要信息。 1、Demo 展示 1. 最小文件 {"manifest_version": 3,&quo…

【算法与数据结构】Java实现查找与排序

文章目录 第一部分&#xff1a;查找算法二分查找插值查找分块查找哈希查找树表查找 第二部分&#xff1a;排序算法冒泡排序选择排序插入排序快速排序 总结 第一部分&#xff1a;查找算法 二分查找 也叫做折半查找&#xff0c;属于有序查找算法。 前提条件&#xff1a;数组数据…

C#MQTT编程07--MQTT服务器和客户端(wpf版)

1、前言 上篇完成了winform版的mqtt服务器和客户端&#xff0c;实现了订阅和发布&#xff0c;效果666&#xff0c;长这样 这节要做的wpf版&#xff0c;长这样&#xff0c;效果也是帅BBBB帅&#xff0c;wpf技术是cs程序软件的福音。 wpf的基础知识和案例项目可以看我的另一个专…

使用Python的pygame库实现下雪的效果

使用Python的pygame库实现下雪的效果 关于Python中pygame游戏模块的安装使用可见 https://blog.csdn.net/cnds123/article/details/119514520 先给出效果图&#xff1a; 源码如下&#xff1a; import pygame import random# 初始化pygame pygame.init()# 设置屏幕尺寸 width…

用Python优雅地写出数学表达式的LaTeX代码

用Python优雅地写出数学表达式的LaTeX代码 目录 Latexify LaTeX 安装方法 版本要求 使用方法 实例一 实例二 实例三 实例四 实例五 Latexify Latexify是一个Python库&#xff0c;它可以将数学表达式转换为LaTeX代码。通过使用latexify-py&#xff0c;可以将数学表达…

传统语音识别系统流程

文章目录 概述语音识别原理公式语音识别术语&#xff1a;分帧提取声学特征声学模型 概述 语音识别传统方法主要分两个阶段&#xff1a;训练和识别&#xff0c;训练阶段主要是生成声学模型和语言模型给识别阶段用。传统方法主要有五大模块组成&#xff0c;分别是特征提取&#…

java使用jsch处理软链接判断是否文件夹

前言 这一次主要是碰到一个问题。因为使用jsch去读取文件的时候&#xff0c;有一些文件它是使用软链接制作的一个映射。因为这里面有一个问题。如果它是软链接你就无法判断他到底是文件。还是文件夹&#xff1f;因为他没有提供可以直接读取的方法&#xff0c;用权限信息去判断…

vue2使用 element表格展开功能渲染子表格

默认样式 修改后 样式2 <el-table :data"needDataFollow" border style"width: 100%"><el-table-column align"center" label"序号" type"index" width"80" /><el-table-column align"cent…

64.Spring事件监听的核心机制是什么?

Spring事件监听的核心机制是什么? spring的事件监听有三个部分组成 事件(ApplicationEvent) 负责对应相应监听器 事件源发生某事件是特定事件监听器被触发的原因监听器(ApplicationListener) 对应于观察者模式中的观察者。监听器监听特定事件,并在内部定义了事件发生后的响应…

关于java中的Super详解

关于java中的Super详解 我们在上一篇文章中了解到了面向对象三大基本特征&#xff0c;继承&#xff0c;我们本篇文章中来了解一下Super&#x1f600;。 一、Super和this调用属性 this&#xff1a;当前类中使用。super&#xff1a;父类使用。 我们直接用代码来说明一下。 1…

如何使用JS逆向爬取网站数据

引言&#xff1a; JS逆向是指利用编程技术对网站上的JavaScript代码进行逆向分析&#xff0c;从而实现对网站数据的抓取和分析。这种技术在网络数据采集和分析中具有重要的应用价值&#xff0c;能够帮助程序员获取网站上的有用信息&#xff0c;并进行进一步的处理和分析。 基…

windows vscode jsoncpp cmake c++ 构建项目

jsoncpp的编译和使用推荐文章&#xff1a;jsoncpp的编译和使用 | 爱编程的大丙 (subingwen.cn)https://www.subingwen.cn/cpp/jsoncpp/从这个链接下载jsoncpp-master&#xff1a;https://github.com/open-source-parsers/jsoncpp 可以把这个文件夹名字改成jsoncpp&#xff0c;…

探索设计模式的魅力:“感受单例模式的力量与神秘” - 掌握编程的王牌技巧

在软件开发的赛场上&#xff0c;单例模式以其独特的魅力长期占据着重要的地位。作为设计模式中的一员&#xff0c;它在整个软件工程的棋盘上扮演着关键性角色。本文将带你深入探索单例模式的神秘面纱&#xff0c;从历史渊源到现代应用&#xff0c;从基础实现到高级技巧&#xf…

未来的NAS:连接您的数字生活

未来的NAS&#xff1a;连接您的数字生活 引言 网络附加存储&#xff08;Network Attached Storage&#xff0c;简称NAS&#xff09;是一种通过网络连接的存储设备&#xff0c;用于集中存储和共享数据。传统的NAS设备通常包含一个或多个硬盘驱动器&#xff0c;可以通过局域网连…

【编码魔法师系列_构建型4】原型模式(Prototype Pattern)

&#x1f449;直达编码魔法师系列其他文章&#x1f448; 学会设计模式&#xff0c;你就可以像拥有魔法一样&#xff0c;在开发过程中解决一些复杂的问题。设计模式是由经验丰富的开发者们&#xff08;GoF&#xff09;凝聚出来的最佳实践&#xff0c;可以提高代码的可读性、可维…