Linux的文件系统

这里写目录标题

  • 一.文件系统的基本组成
    • 索引节点
    • 目录项
    • 文件数据的存储
      • 扇区
      • 三个存储区域
  • 二.虚拟文件系统
    • 文件系统分类
    • 进程文件表
    • 读写过程
  • 三.文件的存储
    • 连续空间存放方式
        • 缺点
    • 非连续空间存放方式
      • 链表方式
        • 隐式链表
        • 缺点
        • 显示链接
      • 索引数据库
        • 缺陷
        • 索引的方式优点:
        • 多级索引
      • 比较
      • 对空闲空间管理
        • 空闲链表法:
        • 位图法

一.文件系统的基本组成

文件系统是操作系统中负责管理持久数据的子系统,说简单点,就是负责把用户的文件存到磁盘硬件中,因为即使计算机断电了,磁盘里的数据并不会丢失,所以可以持久化的保存文件。

  • 文件系统的基本数据单位是文件,它的目的是对磁盘上的文件进行组织管理,那组织的方式不同,就会形成不同的文件系统。
  • Linux中,一切皆是文件,普通目录,文件,块设备,管道,socket,等都是文件系统管理
  • LInux会给每个文件分配两个数据结构:索引节点和目录项目

索引节点

  • 也就是 inode,用来记录文件的元信息,比如 inode 编号、文件大小、访问权限、创建时间、修改时间、数据在磁盘的位置等等。
  • 索引节点是文件的唯一标识,它们之间一一对应,也同样都会被存储在硬盘中,所以索引节点同样占用磁盘空间。
  • 一个文件可以有多个别字。比如,硬链接的实现就是多个目录项中的索引节点指向同一个文件。
  • 通常为了加快读取速度,当文件被访问时,会把索引节点加载到内存中去,

目录项

  • 也就是 dentry,用来记录文件的名字、索引节点指针以及与其他目录项的层级关联关系。
  • 多个目录项关联起来,就会形成目录结构,但它与索引节点不同的是,目录项是由内核维护的一个数据结构,不存放于磁盘,而是缓存在内存。
  • 目录也是文件,也是用索引节点唯一标识,和普通文件不同的是,普通文件在磁盘里面保存的是文件数据,而目录文件在磁盘里面保存子目录或文件。
  • 录是个文件,持久化存储在磁盘,而目录项是内核一个数据结构,缓存在内存。
  • 存在目的:如果查询目录频繁从磁盘读,效率会很低,所以内核会把已经读过的目录用目录项这个数据结构缓存在内存,下次再次读到相同的目录时,只需从内存读就可以,大大提高了文件系统的效率。

文件数据的存储

扇区

磁盘读写的最小单位是扇区,扇区大小是512字节,为了增加读取速度,文件系统把8个扇区组合成一个逻辑块,4kb,提高了读写速率.

三个存储区域

  • 超级块,用来存储文件系统的详细信息,比如块个数、块大小、空闲块等等,当文件系统被挂载时加载进内存。
  • 索引节点区,用来存储索引节点。
  • 数据块区,用来存储文件或目录数据

二.虚拟文件系统

文件系统种类众多,为了统一接口。在用户层和文件系统引入了中间层,这个中间层称为虚拟文件系统
VFS 定义了一组所有文件系统都支持的数据结构和标准接口,这样程序员不需要了解文件系统的工作原理,只需要了解 VFS 提供的统一接口即可
在这里插入图片描述

文件系统分类

  • 磁盘的文件系统,他是直接把数据存储在磁盘中,比如Ext 2/3/4,XFS等都是这类文件系统
  • 内存的文件系统,这类文件系统的数据是存储在内存空间的,比如常见的/proc和/sys,实际上是读写内核中的相关数据
  • 网络的文件系统,用来访问其他主机上的文件系统。

进程文件表

在这里插入图片描述

  • 每一个进程都有个文件表,文件表里的每一项代表「文件描述符」
  • 文件指针:系统跟踪上次读写位置作为当前文件位置指针,这种指针对打开文件的某个进程来说是唯一的;
  • 文件打开计数器:文件关闭时,操作系统必须重用其打开文件表条目,否则表内空间不够用。因为多个进程可能打开同一个文件,所以系统在删除打开文件条目之前,必须等待最后一个进程关闭文件,该计数器跟踪打开和关闭的数量,当该计数为 0 时,系统关闭文件,删除该条目;
  • 文件磁盘位置:绝大多数文件操作都要求系统修改文件数据,该信息保存在内存中,以免每个操作都从磁盘中读取;
  • 访问权限:每个进程打开文件都需要有一个访问模式(创建、只读、读写、添加等),该信息保存在进程的打开文件表中,以便操作系统能允许或拒绝之后的 I/O 请求

读写过程

  • 当用户进程从文件读取 1 个字节大小的数据时,文件系统则需要获取字节所在的数据块,再返回数据块对应的用户进程所需的数据部分。
  • 当用户进程把 1 个字节大小的数据写进文件时,文件系统则找到需要写入数据的数据块的位置,然后修改数据块中对应的部分,最后再把数据块写回磁盘。
  • 文件系统的基本操作单位是数据块

三.文件的存储

文件的数据是要存储在硬盘上面的,数据在磁盘上的存放方式,就像程序在内存中存放的方式那样,有以下两种:

  • 连续空间存放方式
  • 非连续空间存放方式

连续空间存放方式

  • 连续空间存放方式就是把文件存放在连续的物理空间中,这种情况文件数据紧密,读取速率高,磁盘一次寻道就可以读出整个文件。
  • 使用连续存放的一个前提是:必须知道一个文件的大小,这样才能找到相应大小的空间分配给文件
  • 文件头里面需要指定的起始块位置和长度,有这两个信息就可以很好的表示存放
    在这里插入图片描述
缺点

存在大量的磁盘碎片空间,文件长度不易扩展的缺陷

非连续空间存放方式

非连续空间存放方式分为「链表方式」和「索引方式」

链表方式

链表的方式是离散的,不需要连续,于是就可以消除磁盘碎片,可以大大提高磁盘的利用率,同时可以支持文件长度动态扩展。
根据实现的方式的不同,链表可分为「隐式链表」和「显式链接」两种形式

隐式链表

文件要以「隐式链表」的方式存放的话,实现的方式是文件头要包含「第一块」和「最后一块」的位置,并且每个数据块里面留出一个指针空间,用来存放下一个数据块的位置,这样一个数据块连着一个数据块,从链头开是就可以顺着指针找到所有的数据块,所以存放的方式可以是不连续的。
在这里插入图片描述

缺点

在于无法直接访问数据块,只能通过指针顺序访问文件,以及数据块指针消耗了一定的存储空间。隐式链接分配的稳定性较差,系统在运行过程中由于软件或者硬件错误导致链表中的指针丢失或损坏,会导致文件数据的丢失

显示链接
  • 如果取出每个磁盘块的指针,把它放在内存的一个表中,就可以解决上述隐式链表的两个不足。那么,这种实现方式是「显式链接」,它指把用于链接文件各数据块的指针,显式地存放在内存的一张链接表中,该表在整个磁盘仅设置一张,每个表项中存放链接指针,指向下一个数据块号
  • 对于显式链接的工作方式,我们举个例子,文件 A 依次使用了磁盘块 4、7、2、10 和 12 ,文件 B 依次使用了磁盘块 6、3、11 和 14 。利用下图中的表,可以从第 4 块开始,顺着链走到最后,找到文件 A 的全部磁盘块。同样,从第 6 块开始,顺着链走到最后,也能够找出文件 B 的全部磁盘块。最后,这两个链都以一个不属于有效磁盘编号的特殊标记(如 -1 )结束。内存中的这样一个表格称为文件分配表(File Allocation Table,FAT)。
    在这里插入图片描述

缺点是不适合大磁盘,磁盘太大导致表太大

索引数据库

  • 索引的实现是为每个文件创建一个「索引数据块」,里面存放的是指向文件数据块的指针列表,说白了就像书的目录一样,要找哪个章节的内容,看目录查就可以
  • 文件头需要包含指向「索引数据块」的指针,这样就可以通过文件头知道索引数据块的位置,再通过索引数据块里的索引信息找到对应的数据块
  • 创建文件时,索引块的所有指针都设为空。当首次写入第 i 块时,先从空闲空间中取得一个块,再将其地址写到索引块的第 i 个条目
    在这里插入图片描述
缺陷

就是存储索引带来的开销。
索引数据块如果空间不够,可以使用索引链表,
在这里插入图片描述

索引的方式优点:
  • 文件的创建、增大、缩小很方便;
  • 不会有碎片的问题;
  • 支持顺序读写和随机读写;
多级索引

在这里插入图片描述

  • 它是根据文件的大小,存放的方式会有所变化:

    • 如果存放文件所需的数据块小于 10 块,则采用直接查找的方式;
    • 如果存放文件所需的数据块超过 10 块,则采用一级间接索引方式;
    • 如果前面两种方式都不够存放大文件,则采用二级间接索引方式;
    • 如果二级间接索引也不够存放大文件,这采用三级间接索引方式;
  • 那么,文件头(Inode)就需要包含 13 个指针:
    10 个指向数据块的指针;
    第 11 个指向索引块的指针;
    第 12 个指向二级索引块的指针;
    第 13 个指向三级索引块的指针;
    所以,这种方式能很灵活地支持小文件和大文件的存放:

  • 对于小文件使用直接查找的方式可减少索引数据块的开销;

  • 对于大文件则以多级索引的方式来支持,所以大文件在访问数据块时需要大量查询;

  • 这个方案就用在了 Linux Ext 2/3 文件系统里,虽然解决大文件的存储,但是对于大文件的访问,需要大量的查询,效率比较低。

比较

在这里插入图片描述

对空闲空间管理

空闲链表法:

使用链表对空间进行管理,每一个空闲块里有一个指针指向下一个空闲块,这样也能很方便的找到空闲块并管理起来

位图法

位图是利用二进制的一位来表示磁盘中一个盘块的使用情况,磁盘上所有的盘块都有一个二进制位与之对应。
当值为 0 时,表示对应的盘块空闲,值为 1 时,表示对应的盘块已分配。它形式如下:
1111110011111110001110110111111100111 …
在 Linux 文件系统就采用了位图的方式来管理空闲空间,不仅用于数据空闲块的管理,还用于 inode 空闲块的管理,因为 inode 也是存储在磁盘的,自然也要有对其管理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/481378.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++优选算法十七 多源BFS

1.单源最短路问题 一个起点一个终点。 定义:在给定加权图中,选择一个顶点作为源点,计算该源点到图中所有其他顶点的最短路径长度。 2.多源最短路问题 定义:多源最短路问题指的是在图中存在多个起点,需要求出从这些…

DAY141权限提升-Linux系统权限提升篇VulnhubCapability能力LD_Preload加载数据库等

一、演示案例-Linux系统提权-Web&用户-数据库类型 复现环境:Raven: 2 ~ VulnHub 1、信息收集 http://192.168.139.155/vendor/ 2、Web权限获取 searchsploit phpmailer find / -name 40969.py cp /usr/share/exploitdb/exploits/php/webapps/40969.py p.py p…

使用nginx请求转发时前端报跨域问题解决

当其他接口都没有问题,后端也进行了跨域的配置时,此时问题应该就出现在nginx中 我发现当上传文件大小小于1m时并不会发生错误,所以我们应该配置一下nginx允许上传文件的大小 在nginx.conf中添加 在nginx目录下重启nginx即可 (Wi…

凭借 SpringBoot 构建新冠密接者跟踪系统:快速开发与部署优势凸显

第3章 系统分析 在进行系统分析之前,需要从网络上或者是图书馆的开发类书籍中收集大量的资料,因为这个环节也是帮助即将开发的程序软件制定一套最优的方案,一旦确定了程序软件需要具备的功能,就意味着接下来的工作和任务都是围绕着…

28.100ASK_T113-PRO Linux+QT 显示一张照片

1.添加资源文件 2. 主要代码 #include "mainwindow.h" #include "ui_mainwindow.h" #include <QImage> #include <QPixmap>MainWindow::MainWindow(QWidget *parent) :QMainWindow(parent),ui(new Ui::MainWindow) {ui->setupUi(this);QIm…

Android笔试面试题AI答之SQLite(1)

文章目录 1. 阐述什么是SQLite &#xff1f;一、定义与特点二、工作原理三、应用领域四、数据类型与语言绑定 2. Linux 上安装 SQLite方式简述 &#xff1f;一、使用包管理器安装&#xff08;以Debian/Ubuntu为例&#xff09;二、从官方网站下载并编译安装三、注意事项 3. SQLi…

CPU进行float16计算,C++的half.hpp使用方式FP16运算

C不直接支持fp16&#xff0c;如何支持float16的计算&#xff0c;我们使用half包来让C支持fp16计算。half.hpp是C中用于处理半精度浮点数&#xff08;float16&#xff09;的头文件。 一、下载Half包 1.1 下载地址&#xff1a; half&#xff1a;半精度浮点库 2.2 解压缩&…

【C++】LeetCode:LCR 026. 重排链表

题干 LCR 026. 重排链表 给定一个单链表 L 的头节点 head &#xff0c;单链表 L 表示为&#xff1a; L0 → L1 → … → Ln-1 → Ln 请将其重新排列后变为&#xff1a; L0 → Ln → L1 → Ln-1 → L2 → Ln-2 → … 不能只是单纯的改变节点内部的值&#xff0c;而是需要实…

蓝桥杯——递归

1、用递归实现阶乘 5*4*3*2*1120 package day3;public class Demo6 {public static void main(String[] args) {int result f(5);System.out.println(result);}private static int f(int i) {if(i1) {return 1;}return i * f(i-1);}}结果&#xff1a;120 2、爬楼梯 有一个楼…

Y20030012基于php+mysql的药店药品信息管理系统的设计与实现 源码 配置 文档

库存管理系统 1.摘要2. 系统功能3.功能结构图4.界面展示5.源码获取 1.摘要 21世纪是信息的时代&#xff0c;信息技术发展突飞猛进。各种信息化管理系统如雨后春笋一样出现。Internet的迅猛发展使其成为全球信息传递与共享的巨大的资源库。越来越多的网络环境下的Web应用系统被…

基于R语言森林生态系统结构、功能与稳定性分析与可视化

在生态学研究中&#xff0c;森林生态系统的结构、功能与稳定性是核心研究内容之一。这些方面不仅关系到森林动态变化和物种多样性&#xff0c;还直接影响森林提供的生态服务功能及其应对环境变化的能力。森林生态系统的结构主要包括物种组成、树种多样性、树木的空间分布与密度…

【Git 工具】用 IntelliJ IDEA 玩转 Git 分支与版本管理

文章目录 一、使用 IDEA 配置和操作 Git1.1 查看 Idea 中的 Git 配置1.2 克隆 Github 项目到本地 二、版本管理2.1 提交并推送修改2.2 拉取远程仓库2.3 查看历史2.4 版本回退 三、分支管理3.1 新建分支3.2 切换分支3.2 合并分支3.4 Cherry-Pick 参考资料 一、使用 IDEA 配置和操…

Flink学习连载文章8--时间语义

Time的分类 (时间语义) EventTime:事件(数据)时间,是事件/数据真真正正发生时/产生时的时间 IngestionTime:摄入时间,是事件/数据到达流处理系统的时间 ProcessingTime:处理时间,是事件/数据被处理/计算时的系统的时间 EventTime的重要性 假设&#xff0c;你正在去往地下停…

自定义类型: 结构体、枚举 、联合

目录 结构体 结构体类型的声明 匿名结构体 结构的自引用 结构体变量的定义和初始化 结构体成员变量的访问 结构体内存对齐 结构体传参 位段 位段类型的声明 位段的内存分配 位段的跨平台问题 位段的应用 枚举 枚举类型的定义 枚举的优点 联合体(共用体) 联合…

【WPS】【EXCEL】将单元格中字符按照分隔符拆分按行填充到其他单元格

问题&#xff1a;实现如下图的效果 解答&#xff1a; 一、函数 IFERROR(TRIM(MID(SUBSTITUTE($A$2,",",REPT(" ",LEN($A$2))),(ROW(A1)-1)*LEN($A$2)1,LEN($A$2))),"") 二、在单元格C2中填写如下函数 三、全选要填充的单元格并且按CTRLD 函数…

BiGRU:双向门控循环单元在序列处理中的深度探索

一、引言 在当今的人工智能领域&#xff0c;序列数据的处理是一个极为重要的任务&#xff0c;涵盖了自然语言处理、语音识别、时间序列分析等多个关键领域。循环神经网络&#xff08;RNN&#xff09;及其衍生结构在处理序列数据方面发挥了重要作用。然而&#xff0c;传统的 RN…

卸载 Archiconda

一、卸载创建的虚拟环境 # 1.查看所创建的虚拟环境 conda env list# 2.一 一删除创建的虚拟环境&#xff0c;name 替换为自己创建的虚拟环境的名字 conda remove --name name --all二、卸载archidonda rm -rf ~/archiconda3三、删除conda的环境变量 外链图片转存失败,源站可…

【Java基础面试题001】Java中序列化和反序列化是什么?

在Java中&#xff0c;序列化和反序列化是用于将对象的状态保存和恢复的重要机制。 序列化 是将Java对象转换为字节流的过程&#xff0c;这样Java对象才可以网络传输、持久化存储还有缓存。Java提供了java.io.Serializable接口来支持序列化&#xff0c;只要类实现了这个接口&a…

前端学习week8——vue.js

Vue.js 基础 Vue 核心概念&#xff1a;了解 Vue 的响应式系统、组件、指令&#xff08;如 v-if、v-for、v-model 等&#xff09;。Vue 项目管理&#xff1a;学习 Vue CLI 或 Vite&#xff0c;掌握项目创建、管理和打包。推荐学习顺序&#xff1a;Vue 基础 → 组件化开发 → Vu…

Excel如何限制单元格内可选择的下拉框内容?

先选择想要的表格区域&#xff1a; 如果想要选中如下所示&#xff1a;C2格子及其下面所有的格子&#xff08;则&#xff1a;点击一下C2格子&#xff0c;然后按一下键盘&#xff1a;SHIFT CTRL ↓&#xff09; 然后在【sheet2】表&#xff0c;先填写好下拉框可选择的内容&am…