Linux——IO

✅<1>主页::我的代码爱吃辣
📃<2>知识讲解:Linux——文件系统
☂️<3>开发环境:Centos7
💬<4>前言:是不是只有C/C++有文件操作呢?python,java,php,go ..... 他们都是有文件操作?他们的文件操作一样吗?他们都有文件操作,且根据语言的语法不同,文件操作也是不同的。有没有一种同意的视角,看待所有语言的文件操作呢?

目录

一.回顾C文件IO相关操作

1.C语言文件写入

2.C语言文件读取

 3.输出信息到显示器有哪些方法

二.系统文件IO

1.open

 2.write

3.close

 4.read

三.对比C库与系统调用

四.如何管理文件

1.操作系统如何管理文件 

2.进程如何管理文件 ——文件描述符

3.文件描述符的分配规则

 三.重定向

1.重定向原理

2.dup2 系统调用

 四.理解FILE


一.回顾C文件IO相关操作

1.C语言文件写入

测试代码:

#include <stdio.h>
#include <string.h>
int main()
{FILE *fp = fopen("myfile", "w");if (!fp){printf("fopen error!\n");}const char *msg = "hello Linux!\n";const char *msg2 = "hello C++!\n";int count = 5;while (count--){// 向文件中写入,// 参数1:写入的数据C++// 参数2:写入的字符个数// 参数3:写入的数据元素的个数// 参数4:写入的文件结构体指针fwrite(msg, strlen(msg), 1, fp);}int n = 5;while (n--){// 向文件中写入,// 参数1:写入的文件结构体指针// 参数2:格式化写入fprintf(fp, "[%d]:%s", n, msg2);}fclose(fp);return 0;
}

测试结果:

2.C语言文件读取

#include <stdio.h>
#include <string.h>
int main()
{FILE *fp = fopen("myfile", "r");if (!fp){printf("fopen error!\n");}char buf[1024];const char *msg = "hello bit!\n";while (1){// 注意返回值和参数,此处有坑,仔细查看man手册关于该函数的说明size_t s = fread(buf, 1, strlen(msg), fp);if (s > 0){buf[s] = 0;printf("%s", buf);}if (feof(fp)){break;}}fclose(fp);return 0;
}

 3.输出信息到显示器有哪些方法

#include <stdio.h>
#include <string.h>
int main()
{const char *msg = "hello fwrite\n";// 1.fwritefwrite(msg, strlen(msg), 1, stdout);// 2.printfprintf("hello printf\n");// 3.fprintffprintf(stdout, "hello fprintf\n");return 0;
}

C库常见IO接口:

    // 1.默认向显示器格式化打印int printf(const char *format, ...);// 2.向指定的文件中格式化输入int fprintf(FILE * stream, const char *format, ...);// 3.向指定的空间中格式化输入int sprintf(char *str, const char *format, ...);// 4.向指定的空间中格式化输入指定个数字符int snprintf(char *str, size_t size, const char *format, ...);

 总结:

  1. C默认会打开三个输入输出流,分别是stdin, stdout, stderr
  2. 仔细观察发现,这三个流的类型都是FILE*, fopen返回值类型,文件指针

二.系统文件IO

操作文件,除了上述C接口(当然,C++也有接口,其他语言也有),我们还可以采用系统接口来进行文件访问,先来直接以代码的形式,实现和上面一模一样的代码:

1.open

隆重介绍一个系统调用:

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);

pathname: 要打开或创建的目标文件
flags: 打开文件时,可以传入多个参数选项,用下面的一个或者多个常量进行“或”运算,,就是一种位图结构,flags参数:

  1. O_RDONLY: 只读打开
  2. O_WRONLY: 只写打开
  3. O_RDWR : 读,写打开
  4. 这三个常量,必须指定一个且只能指定一个
  5. O_CREAT : 若文件不存在,则创建它。需要使用mode选项,来指明新文件的访问权限
  6. O_APPEND: 追加写

 返回值:

  • 成功:新打开的文件描述符
  • 失败:-1

 2.write

       #include <unistd.h>ssize_t write(int fd, const void *buf, size_t count);

参数介绍:

  1. fd:要写入的文件描述符。
  2. buf:要写入的字符串。
  3. count:写入的个数。

3.close

       #include <unistd.h>int close(int fd);

 关闭指定的文件描述符的文件。

测试代码:

#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>int main()
{// fd:文件描述符// mufile:打开的文件名// O_WRONLY :写方式 | O_CREAT:没有该文件就创建 | O_APPEND : 追加写入int fd = open("myfile", O_WRONLY | O_CREAT | O_APPEND, 0666);if (fd == -1){perror("open");}int count = 5;char *msge = "hello C++ and Linux\n";while (count--){ssize_t n = write(fd, msge, strlen(msge));if (n == -1){perror("write:");}}close(fd);return 0;
}

测试结果:

 4.read

       #include <unistd.h>ssize_t read(int fd, void *buf, size_t count);

参数:

  1. fd:读取文件的文件描述符
  2. buf:存储读取出的数据的缓冲区
  3. count:最大读取个数

返回值:

  • 读取成功:返回读取的字节数。
  • 读取失败:返回-1.

 测试代码:

#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>int main()
{// fd:文件描述符// mufile:打开的文件名// ORDONLY:独方式打开int fd = open("myfile", O_RDONLY);if (fd == -1){perror("open");}char buff[1024];// fd:读取文件的文件描述符// buff:存储读取数据的缓冲区// 1024:最大读取字节数ssize_t n = read(fd, buff, 1024);if (n == -1){perror("write:");}printf(buff);close(fd);return 0;
}

 测试结果:

三.对比C库与系统调用

我们真正理解语言层面的文件操作吗?其实我们并不理解,因为这不是语言问题,这是系统问题。

是不是只有C/C++有文件操作呢?python,java,php,go ..... 他们都是有文件操作?他们的文件操作一样吗?他们都有文件操作,且根据语言的语法不同,文件操作也是不同的。有没有一种同意的视角,看待所有语言的文件操作呢?

在认识返回值之前,先来认识一下两个概念: 系统调用 和 库函数:

 上面的 fopen fclose fread fwrite 都是C标准库当中的函数,我们称之为库函数(libc)。
而, open close read write 都属于系统提供的接口,称之为系统调用接口回忆一下我们讲操作系统概念时,画的一张图:

系统调用接口和库函数的关系,一目了然。
所以,可以认为,f#系列的函数,都是对系统调用的封装,方便二次开发。

只要语言层支持了文件操作,那么语言层对下必然封装了系统调用。

四.如何管理文件

1.操作系统如何管理文件 

文件=内容+属性。

当一个文件没有被操作时,文件一般会被放在磁盘上。

当我们对一个文件进程操作的时候,文件需要被放进内存,因为冯诺依曼体系的限定!

当我们对文件进程操作的时候,文件需要被load到内存,load的是属性还是内容?至少要有属性被load。

当我们对文件进程操作的时候,文件需要被提前放进内存,操作文件的又不是我们一个,所以OS内部移动同时存在大量被打开的文件。那么操作系统如何管理这些被打开的文件呢?创建对应的结构体进行抽象,和数据机构进行组织。

每一个被打开的文件,都要在OS内部对应文件对象的struct结构体,可以将所有的struct_file结构体用某种数据结构连接起来,在OS内部,对被打开的文件进行管理,就转换成对链表的增删查改。

2.进程如何管理文件 ——文件描述符

 文件可以分为两大类,磁盘文件(没有被打开),内存文件(被打开)。

文件被打开,是指文件被以进程为代表的用户让操作系统打开的。

所以之前的文件操作,都是进程与被打开文件之间的关系。在OS的角度,就是PCB与struct_file的关系。

那么进程是如何管理自己打开的文件的呢?

open返回值:

#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>int main()
{// 打开一个文件int fd = open("testfile", O_WRONLY | O_CREAT, 0666);// 打印文件描述符printf("%d\n", fd);return 0;
}

通过对open函数的学习,我们知道了文件描述符就是一个小整数。

 这里为什么是3?我们多打开几个文件看看:

#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>int main()
{// 打开一个文件int fd = open("testfile", O_WRONLY | O_CREAT, 0666);int fd1 = open("testfile1", O_WRONLY | O_CREAT, 0666);int fd2 = open("testfile2", O_WRONLY | O_CREAT, 0666);int fd3 = open("testfile3", O_WRONLY | O_CREAT, 0666);// 打印文件描述符printf("%d\n", fd);printf("%d\n", fd1);printf("%d\n", fd2);printf("%d\n", fd3);return 0;
}

我们发现打印出的是连续的整数。但是没有还是从3开始的,那么会不会有0,1,2呢?

0 & 1 & 2 :

  1. Linux进程默认情况下会有3个缺省打开的文件描述符,分别是标准输入0, 标准输出1, 标准错误2.
  2. 0,1,2对应的物理设备一般是:键盘,显示器,显示器

 所以输入输出还可以采用如下方式:

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>
int main()
{char buf[1024];// 0:标准输入的文件描述符——键盘文件ssize_t s = read(0, buf, sizeof(buf));if (s > 0){buf[s] = 0;// 写入1号文件描述符的文件中——显示器文件// 写入2号文件描述符的文件中——显示器文件write(1, buf, strlen(buf));write(2, buf, strlen(buf));}return 0;
}

而现在知道,文件描述符就是从0开始的小整数。当我们打开文件时,操作系统在内存中要创建相应的数据结构来描述目标文件,于是就有了file结构体。表示一个已经打开的文件对象。而进程执行open系统调用,所以必须让进程和文件关联起来。每个进程都有一个指针*files, 指向一张表files_struct,该表最重要的部分就是包涵一个指针数组,每个元素都是一个指向打开文件的指针!所以,本质上,文件描述符就是该数组的下标。所以,只要在进程PCB中拿着文件描述符,就可以找到对应的文件。

3.文件描述符的分配规则

 测试代码:

#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>int main()
{close(0);int fd = open("testfile", O_WRONLY | O_CREAT, 0666);close(2);int fd1 = open("testfile1", O_WRONLY | O_CREAT, 0666);int fd2 = open("testfile2", O_WRONLY | O_CREAT, 0666);// 打印文件描述符printf("%d\n", fd);printf("%d\n", fd1);printf("%d\n", fd2);return 0;
}

测试结果:

 说明:

  1. 当我们关闭0,2号文件描述符,0,2文件描述符空着,新打开的文件描述符不再从3开始。
  2. fd: 0 或者 fd 2 可见,文件描述符的分配规则:在files_struct数组当中,找到当前没有被使用的最小的一个下标,作为新的文件描述符。

 三.重定向

1.重定向原理

 上述代码如果我们关闭的是1号文件描述符:

#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>int main()
{close(0);int fd = open("testfile", O_WRONLY | O_CREAT, 0666);// 如果关闭1号文件描述符close(1);int fd1 = open("testfile1", O_WRONLY | O_CREAT, 0666);int fd2 = open("testfile2", O_WRONLY | O_CREAT, 0666);// 打印文件描述符printf("%d\n", fd);printf("%d\n", fd1);printf("%d\n", fd2);return 0;
}

测试结果:

说明:

  1. 本应该输出到显示器的内容,却输出到了文件中。这种现象就叫做重定向。
  2. 常见的重定向有:>, >>, <,输出重定向,追加重定向,输入重定向。

重定向的本质:

说明:

原本输入到显示器的数据输入到了其他文件,仅仅通过更改struct file*fdarray[ ]对应下标的存储的指针。

2.dup2 系统调用

#include <unistd.h>int dup2(int oldfd, int newfd)

说明:

  • oldfd:需要重定向的文件描述符。
  • newfd:被重定向的文件描述符。

 测试代码:

#include <stdio.h>
#include <unistd.h>
#include <fcntl.h>
int main()
{int fd = open("./log", O_CREAT | O_RDWR, 0666);if (fd < 0){perror("open");return 1;}close(1);// 将fd对应的文件,重定向到1号文件描述符dup2(fd, 1);for (;;){char buf[1024] = {0};ssize_t read_size = read(0, buf, sizeof(buf) - 1);if (read_size < 0){perror("read");break;}printf("%s", buf);fflush(stdout);}return 0;
}

测试结果:

printf是C库当中的IO函数,一般往 stdout 中输出,但是stdout底层访问文件的时候,找的还是fd:1, 但此时,fd:1下标所表示内容,已经变成了./log的地址,不再是显示器文件的地址,所以,输出的任何消息都会往文件中写入,进而完成输出重定向。

 四.理解FILE

因为IO相关函数与系统调用接口对应,并且库函数封装系统调用,所以本质上,访问文件都是通过fd访问的。所以C库当中的FILE结构体内部,必定封装了fd。

测试代码:

#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>int main()
{int fd = open("testfile", O_CREAT | O_WRONLY, 0666);int fd1 = open("testfile1", O_CREAT | O_WRONLY, 0666);printf("%d\n", stdin->_fileno);printf("%d\n", stdout->_fileno);printf("%d\n", stderr->_fileno);printf("%d\n", fd);printf("%d\n", fd1);return 0;
}

测试结果:

看一段代码:

#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
int main()
{const char *msg0 = "hello printf\n";const char *msg2 = "hello write\n";printf("%s", msg0);write(1, msg2, strlen(msg2));fork();return 0;
}

运行结果:

看到这里一切正常,如果我们将输出到显示器的数据,重定向到其他文件中:

 我们发现 printf 输出了2次,而 write 只输出了一次(系统调用)。为什么呢?肯定和fork有关!

  •  一般C库函数写入文件时是全缓冲的,而写入显示器是行缓冲。
  • printf fwrite 库函数会自带缓冲区(进度条例子就可以说明),当发生重定向到普通文件时,数据的缓冲方式由行缓冲变成了全缓冲。
  • 而我们放在缓冲区中的数据,就不会被立即刷新,fork之后。
  • 但是进程退出之后,会统一刷新,写入文件当中。
  • 但是fork的时候,父子数据会发生写时拷贝,所以当你父进程准备刷新的时候,子进程也就有了同样的一份数据,随即产生两份数据。
  • write 没有变化,说明没有所谓的缓冲,而是直接写入文件。

 综上:

  1. printf fwrite 等库函数会自带缓冲区,而 write 系统调用没有带缓冲区。
  2. 另外,我们这里所说的缓冲区,都是用户级缓冲区。其实为了提升整机性能,OS也会提供相关内核级缓冲区,不过不再我们讨论范围之内。
  3. 那这个缓冲区谁提供呢? printf fwrite 是库函数, write 是系统调用,库函数在系统调用的“上层”, 是对系统调用的“封装”,但是 write 没有缓冲区,而 printf fwrite 有,足以说明,该缓冲区是二次加上的,又因为是C,所以由C标准库提供。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/136543.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu安装中文拼音输入法

ubuntu安装中文拼音输入法 ubuntu版本为23.04 1、安装中文语言包 首先安装中文输入法必须要让系统支持中文语言&#xff0c;可以在 Language Support 中安装中文语言包。 添加或删除语音选项&#xff0c;添加中文简体&#xff0c;然后会有Applying changes的对话框&#x…

源码编译Qt 5.15.9+msvc2019

官方文档里给出了详细步骤&#xff1a; Building Qt Sources Building Qt 5 from Git (Wiki) 注&#xff1a;本文基于windows11vs2019x64qt5.15.9&#xff0c;不编译Qt WebEngine 归纳总结如下&#xff1a; 准备阶段 Qt for Windows - Requirements 安装python&#xff0c;…

逼自己看完,Redis的事务你就掌握了!!!

目录 1、对于事务的理解 1.1、回顾MySQL的事务 1.2、Redis的事务 2、事务命令使用 3、watch的实现原理 3.1、watch用来干什么的&#xff1f; 3.2、watch的实现原理 1、对于事务的理解 1.1、回顾MySQL的事务 在MySQL中&#xff0c;事务有4个特性&#xff1a; 原子性&a…

MyBatis中当实体类中的属性名和表中的字段名不一样,怎么办

方法1&#xff1a; 在mybatis核心配置文件中指定&#xff0c;springboot加载mybatis核心配置文件 springboot项目的一个特点就是0配置&#xff0c;本来就省掉了mybatis的核心配置文件&#xff0c;现在又加回去算什么事&#xff0c;总之这种方式可行但没人这样用 具体操作&…

详细介绍如何微调 YOLOv8 姿势模型以进行动物姿势估计--附完整源码

动物姿势估计是计算机视觉的一个研究领域,是人工智能的一个子领域,专注于自动检测和分析图像或视频片段中动物的姿势和位置。目标是确定一只或多只动物身体部位的空间排列,例如头部、四肢和尾巴。这项技术具有广泛的应用,从研究动物行为和生物力学到野生动物保护和监测。 …

【LeetCode-中等题】107. 二叉树的层序遍历 II

文章目录 题目方法一&#xff1a;队列层序迭代 题目 方法一&#xff1a;队列层序迭代 解题详情&#xff1a;【LeetCode-中等题】102. 二叉树的层序遍历 res.add(0,zres); //效果是将 zres 列表作为 res 的第一个子列表&#xff0c;并将其它原本在第一位置及之后的子列表向后移…

Python项目开发:Flask基于Python的天气数据可视化平台

目录 步骤一&#xff1a;数据获取 步骤二&#xff1a;设置Flask应用程序 步骤三&#xff1a;处理用户输入和数据可视化 步骤四&#xff1a;渲染HTML模板 总结 在这个数字化时代&#xff0c;数据可视化已经成为我们理解和解释信息的重要手段。在这个项目中&#xff0c;我们…

JavaScript速成课—事件处理

目录 一.事件类型 1.窗口事件 2.表单元素事件 3.图像事件 4.键盘事件 5.鼠标事件 二.JavaScript事件处理的基本机制 三.绑定事件的方法 1.DOM元素绑定 2.JavaScript代码绑定事件 3.监听事件函数绑定 四.JavaScript事件的event对象 1.获取event对象 2.鼠标坐标获取…

下载HTMLTestRunner并修改

目录 一. 下载HTMLTestRunner 二. 修改HTMLTestRunner 1. 修改内容 2. 修改原因 一. 下载HTMLTestRunner 下载报告模板地址:http://tungwaiyip.info/software/HTMLTestRunner.html 下载模块&#xff1a; 二. 修改HTMLTestRunner 将修改后的模块放到python安装目录下的..…

Harmony 开始支持 Flutter ,聊聊 Harmony 和 Flutter 之间的因果

相信大家都已经听说过&#xff0c;明年的 Harmony Next 版本将正式剥离 AOSP 支持 &#xff0c;基于这个话题我已经做过一期问题汇总 &#xff0c;当时在现有 App 如何兼容 Harmony Next 问题上提到过&#xff1a; 华为内部也主导适配目前的主流跨平台方案&#xff0c;主动提供…

QT在安装后添加新组件【QT基础入门 环境搭建】

一、Qt的安装目录下找到MaintenanceTool工具 二、双击该exe文件运行该工具(界面可能不相同但功能一样) 登录账号,进入以下界面,点击下一步 选择更新组件,出现以下提示 三、此时需要手动添加储存库 1.进入下面网站,选择一个国内镜像 Qt Downloads 点击后面的HTTP可进入…

info文档与man手册

man 手册 man --version# 查看版本 man 2 socket# 查看section2中的socket yum install man-pages# 更新man手册man -f socket# 列出所有章节的socket # man -f刚开始使用的时候不显示 # centos7执行mandb命令,7以下的版本执行makewhatis命令 # 之后执行man -f就生效了 [rootk…

Jmeter —— 常用的几种断言方法(基本用法)

在使用JMeter进行性能测试或者接口自动化测试工作中&#xff0c;经常会用到的一个功能&#xff0c;就是断言&#xff0c;断言相当于检查点&#xff0c;它是用来判断系统返回的响应结果是否正确&#xff0c;以此帮我们判断测试是否通过&#xff0c;本文 主要介绍几种常用的断言&…

计算机算法分析与设计(3)---循环赛日程表(含代C++码)

循环赛日程表 一、内容概述二、代码实现2.1 分治代码2.2 结果图 一、内容概述 二、代码实现 2.1 分治代码 // 循环赛日程表 #include<iostream> #include<cmath> using namespace std;void schedule(int k, int n, int** array) // 数组下标从1开始 {for (int …

数字孪生基础设施需求分析

数字孪生基础设施需求分析 “基础设施”&#xff08;infrastructure&#xff09;新型基础设施建设 “基础设施”&#xff08;infrastructure&#xff09; 一词最早于1875年在法文中出现&#xff0c;但该词汇由拉丁文构成&#xff0c;infrastructure分为infra&#xff08;拉丁文…

win10 安装 Langchain-Chatchat 避坑指南(2023年9月18日v0.2.4版本,包含全部下载内容!)

网上教程都是基于外网或者翻墙的&#xff0c;而且细节极其不清晰&#xff0c;尤其是最关键的模型下载。 另外提一句&#xff0c;我的显卡是&#xff1a;3080Ti 16GB版本&#xff0c;运行之后&#xff0c;显存占用13-14GB 1、安装Anaconda&#xff08;这个就不啰嗦了&#xff0c…

Idea创建springboot项目

1、选择file—>new –->project 2、选择“Spring Initializr”&#xff0c;点击“next”&#xff0c;进入工程信息配置界面修改配置信息. 备注&#xff1a;type类型选择“Maven(Generate a Maven based project achieve)”&#xff0c;生成工程路径。 3、点击next按钮&a…

最全测试管理岗面试题(上)

1、怎么改善团队低迷现状&#xff1f; 改善团队低迷的现状是一个重要的管理挑战。以下是一些可能有助于改善团队状态的方法&#xff1a; ① 深入了解问题&#xff1a;首先&#xff0c;需要了解低迷的原因。这可能涉及与团队成员的个人会谈&#xff0c;收集反馈&#xff0c;观…

Java微信支付集成开发

文章目录 [toc] 1.接入前准备1.1 微信商户平台注册商户号1.1.1 微信支付商户接入指引1.1.2 微信支付服务商接入指引 1.2 微信开放平台注册小程序和公众号1.3 微信开放平台注册开发者账号1.4 微信商户平台绑定小程序和公众号的appId账号1.4.1 微信公众平台扫码登录微信公众号账号…

C++:初始化列表,static成员,友元,内部类

个人主页 &#xff1a; 个人主页 个人专栏 &#xff1a; 《数据结构》 《C语言》《C》 文章目录 前言一、初始化列表二、static成员三、友元四、内部类总结 前言 本篇博客作为C&#xff1a;初始化列表&#xff0c;static成员&#xff0c;友元&#xff0c;内部类的知识总结。 一…