速通C语言第十二站文件操作

系列文章目录

速通C语言系列

速通C语言第一站一篇博客带你初识C语言   http://t.csdn.cn/N57xl

速通C语言第二站一篇博客带你搞定分支循环 http://t.csdn.cn/Uwn7W

速通C语言第三站一篇博客带你搞定函数 http://t.csdn.cn/bfrUM

速通C语言第四站  一篇博客带你学会数组   http://t.csdn.cn/Ol3lz

速通C语言第五站一篇博客带你详解操作符   http://t.csdn.cn/OOUBr

速通C语言第六站一篇博客带你掌握指针初阶   http://t.csdn.cn/7ykR0

速通C语言第七站一篇博客带你掌握数据的存储 http://t.csdn.cn/qkerU

速通C语言第八站一篇博客带你掌握指针进阶    http://t.csdn.cn/m95FK

速通C语言第八.五站指针进阶题目练习   http://t.csdn.cn/wWC2x

速通C语言第九站字符相关函数及内存函数    http://t.csdn.cn/YyBBM

速通C语言第十站自定义类型                          http://t.csdn.cn/jsGJ7

速通C语言第十一站动态内存开辟                  http://t.csdnimg.cn/necjp

感谢佬们支持！首先祝大家元旦快乐！

文章目录

系列文章目录
前言
1、为什么使用文件
2、什么是文件
文件名
3、文件的打开和关闭
4、文件的顺序读写
流
一次读一个
一次读一行
格式化输入输出函数
二进制输入输出函数
综合对比
5、文件的随机读写
6、文本文件和二进制文件
7、文件读取结束的判定
8、文件缓冲区
总结

前言

在学习之前，我家首先要知道，文件/文件系统是一个很重要的东西，而且研究文件只停留在语言层面是非常片面的。等我们学到操作系统后，才会对此有一个更深的理解.

1、为什么使用文件

比如说我们写一个通讯录，运行之后进行增删查改，但是退出程序后我们的数据就没了

要想有信息拷贝，就要把数据写到文件中。

2、什么是文件

文件分为两种，一种为数据文件，另一种为程序文件（内存文件）

程序文件分为3种：1、我们写的.c文件

2、编译过程中产生的临时文件 .i ,.s .o

3、最后生成的可执行程序 .exe

而数据文件简单来说就是我们能从这个文件中读点数据，也能将程序中的文件写到文件中

文件名

一个文件需要一个唯一的文件标识符，在我们看来是文件名(但是在操作系统看来不是)

文件名由三部分构成

文件路径+文件名+后缀（注：在Linux系统中文件后缀没用）

例：

C:\code\test.txt

而文件的路径分为两种

一种叫绝对路径，表示从根目录一直到你当前文件的路径

例如/c/Users/86138/tDesktop/test.c

还有一种叫相对路径，可以表示当前路径或上级路径的文件

比如test.c ../test.c

3、文件的打开和关闭

每一个被打开的文件都在内存中用一个结构体维护，用于存放文件的部分信息（如文件存放的位置，文件的状态信息等），这个结构体被typedef为FILE

所以我们要想对这个文件做什么，就要用文件指针FILE*调用

关闭一个文件，我们用fclose函数

如果关闭成功，返回0，失败返回EOF

打开一个文件，我们用fopen函数

其中，第一个参数为文件的名字，第二个参数为打开文件的方式，有6种选项选择（我们重点研究前三个）

如果打开成功，返回一个文件指针，失败就返回NULL

我们写一波代码给大家看一下

我们先以写打开一个文件，用“w"选项，

意为，如果文件存在，会先清空再打开，如果不存在，会创建出来

FILE* pf = fopen("test.txt", "w");if (pf == NULL){printf("打开失败\n");}//写文件//关文件fclose(pf);pf = NULL;

运行之后打开代码所在的目录

（果然多了一个test.txt）

写了之后我们在读一个文件

FILE* pf = fopen("test.txt", "r");if (pf == NULL){perror("fopen\n");}

读和写不同，如果没有该文件，会直接报错（使用perror函数）

4、文件的顺序读写

流

我们先来补充一个流的概念，流的概念很抽象，我们在没学操作系统之前，只能稍微理解一下

众所周知，我们储存一个程序文件有很多硬件来选择，比如屏幕（屏幕显示文件的本质也是存储），硬盘，U盘，网络

所以选择很多，不同选择的读写方式肯定不同，而在软件层面要考虑所有选择的读写方式显然太SB了，所以我们抽象一个“流”的概念出来,其类型为FILE*

我们在写文件的时候向流中写，剩下向右边的东西怎么写是操作系统的事，他会以多态的方式实现一系列方法，这些都是以后再学的啦

另外，当C语言程序运行起来，就默认打开了3个流

0 stdin (标准输入流)   对应得硬件是键盘

1   stdout(标准输出流) 对应得硬件是屏幕

2   stderr(标准输出错误流) 对应得硬件也是屏幕

一次读一个

我们用fputc/fgetc可以从指定流中输出/输入一个数据

我们尝试向标准输出stdout（显示器）输出3个字母

fputc('z', stdout);fputc('y', stdout);fputc('g', stdout);

再尝试从标准输入stdin中读几个字符

既然我们能从stdout，stdin里读写，那么文件也可以

创建一个test.txt

FILE* pf = fopen("test.txt", "w");//写fputc('a', pf);fputc('b', pf);fputc('c', pf);

查看一下test.txt

(成功)

再读

FILE* pf = fopen("test.txt", "r");int ret = fgetc(pf);printf("%c\n", ret);

第二次读

一次读一行

一次读写一个字符，太慢了

由此我们提供fgets读一行，fputs写一行

注意：num代表读取的最大个数，如果num=100，则实际读99个，因为要预留一个\0的位置

（因为无论如何这都是在语言的层面读写，就要遵守语言的规则以\0结尾）

另外，如果某一行的大小+1（\0的大小）<num,那就只读这一行，不读下一行

例：

FILE* pf = fopen("test.txt", "w");fputs("abc\n", pf);fputs("qwe\n", pf);fclose(pf);pf = NULL;

打开文件

读

FILE* pf = fopen("test.txt", "r");char arr[10] = { 0 };fgets(arr, 4, pf);printf("%s\n", arr);

先读4个，发现只读了第一行

fgets(arr, 5, pf);printf("%s\n", arr);

改成读5个，他依然只读第一行

格式化输入输出函数

fprintf

fscanf

const char* format是我要输的格式，就和我们学的printf，scanf一样

例：

struct S{char arr[10];int num;float sc;};struct S s = { "abcdef",10,5.5};FILE* pf = fopen("test.txt", "w");if (pf == NULL){perror("fopen");}fprintf(pf, "%s %d %f",s.arr,s.num,s.sc);

二进制输入输出函数

fread

从流中读count个size大小的数据到buffer中

fwrite

把buffer中count个size大小的数据写入buffer中

例：

struct S{char arr[10];int num;float sc;};struct S s = { "abcdef",10,5.5 };FILE* pf = fopen("test.txt", "wb");//二进制写，wbif (pf == NULL){perror("fopen\n");}fwrite(&s, sizeof(struct S), 1, pf);

字符串从二进制写进去还是一样，但是数字不行，我们看不懂

我们看不懂，但是fread可以

struct S s = {0 };FILE* pf = fopen("test.txt", "rb");//二进制读，rbfread(&s, sizeof(struct S), 1, pf);printf("%s %d %f", &s.arr, s.num, s.sc);

读一下

struct S{char arr[10];int num;float sc;};struct S s = { 0};FILE* pf = fopen("test.txt", "r");if (pf == NULL){perror("fopen");}fscanf(pf, "%s %d %f",s.arr,&(s.num),&(s.sc));//记得加&printf("%s %d %f", s.arr, s.num, s.sc);

综合对比

我们再补充一个sscanf和sprintf，

从一个字符串中读取一个格式化的数据，其中，format代表格式

再加上我们熟悉的scanf和fscanf

scanf，从标准输入stdin（键盘）输入格式化的语句

针对所有输出流的格式化输入语句，其中输出流包括stdin和文件，也就是说scanf是fscanf的子集

	fscanf(0,const char* format...)//等价于scanf

把一个字符串中转换一个格式化的数据，其中，format代表格式

printf,针对标准输出stdout(显示器) 的格式化输出语句

fprintf,针对所有输出流的格式化输出语句，同上，标准输出流包括stdout和文件

		fprintf(1, const char* format...)//等价于printf

5、文件的随机读写

随机读写意为想读哪读哪

之前我们学的顺序读写只能从开头往下一个一个读，有了随机读写，我们可以从任意地方开始读。

第二个参数表示偏移量

第三个参数表示起始位置，有三种选择

SEEK_CUR 当前文件指针的位置

SEEK_END 文件末，此时偏移量只能为负，即从后向前读（但是其封装的系统调用lseek中为可正可负，会对文件相应扩容，并产生文件空洞等，此处可以忽略）

SEEK_SET 文件开始，此时偏移量只能为正，即从头开始读

我们写个代码来用一下这个函数

先将我们的test.txt中写上abcdef

FILE* pf = fopen("test.txt", "r");int ch = fgetc(pf);printf("%c\n", ch);//ach = fgetc(pf);printf("%c\n", ch);//bch = fgetc(pf);printf("%c\n", ch);//c

显然，再往下读就是d了，现在我们又想读b了，怎么办？调整一下文件指针，往前推两个

fseek(pf, -2, SEEK_CUR);ch = fgetc(pf);printf("%c\n", ch);

（又读到b了，牛逼）

与之补充的还有两个函数

ftell

可以返回我们当前文件的偏移量

例：

（我们当前读完了b，要读c，所以偏移量为2）

rewind

让文件指针的位置又回到文件开始

例：

printf("文件的偏移量为：%d\n", ftell(pf));rewind(pf);printf("文件的偏移量为：%d\n", ftell(pf));

6、文本文件和二进制文件

根据数据得组织形式，数据文件被称为文本文件/二进制文件

二进制文件：数据在内存中以二进制形式储存，如果不加转换得输出到外存，就是二进制文件

文本文件：如果要求在外存上以ASCII码的形式存储，则需要在存储前转换以ASCII码的形式存储的文件就是文本文件。

对应到数据就是

字符：一律ASCII码

数值型数据：既可以ASCII码，又可以二进制

例：

给一个整数10000（int），以ASCII码存就是占5个字节，但是以二进制形式就是4个字节

7、文件读取结束的判定

feof

注意：在文件读取中，绝不能用feof的返回值来判断文件是否结束，而是应用于文件已经结束了，是读取失败结束的，还是遇到文件结尾结束的。

文件正常结束会返回一个非0的值

ferror

不为-1就是打开失败

所以到底该怎么判断文件结束？

对于文本文件，判断返回值是否未EOF（end of file）

对于二进制，fread在读取时，返回的是实际读取完整元素的个数，如果发现读取到的完整元素的个数<指定元素的个数，这就是最后一次读取了（但实际上在系统调用read的层面，有很多情况都能导致读到的完整元素个数(ssize_t)<指定元素个数，此处我们不做考虑）。

用上面的方法得知文件结束后我们再用feof函数

例：

假设test.txt文件中有一份代码，要求把test.txt文件拷贝一份，生成test2.txt

test.txt

int main()
{FILE* pfread = fopen("test.txt", "r");if (pfread == NULL){perror("fopen\n");}//写文件FILE* pfwrite = fopen("test2.txt", "w");if (pfwrite == NULL){//这次打开失败了说明第一次打开成功了，所以得释放第一个fclose(pfread);pfread = NULL;return 1;}//从pfread里读，写到pfwrite里int ch = 0;while ((ch = fgetc(pfread)) != EOF){fputc(ch, pfwrite);}//关文件fclose(pfread);pfread = NULL;fclose(pfwrite);pfwrite = NULL;
}

运行之后

test2果然也有了相同的代码

下来该判断文件如何结束的了

if (ferror(pfread))puts("I/O error when reading\n");else if (feof(pfread))puts("EOF reach successfully\n");

（正常结束了）

8、文件缓冲区

先给到大家一张图，然后再举一个例子

先举个现实生活中的例子

比如你在北京，你的朋友在济南，你想给他寄一个东西，所以你就跑到你们学校的快递站，填好信息。

   此时你的快递就被寄出去了吗？没有，为什么？为什么不马上寄出去？

   如果说你刚走了，快递被一辆车寄出去了，又有一个人来了，填的信息也是寄向济南，然后再派一辆车寄吗？这成本太高了，肯定不能这么做

   所以怎么办？快递站有一个专门放寄往济南的柜子，柜子满了再寄，也就是要等一波寄往济南的快递，然后只派一辆车寄，这成本就小很多了呀

对应于计算机我们再举一个例子

比如我写数据，我想往硬盘上写，但是这数据不是你能写的，你得告诉操作系统给你写、

操作系统是很忙的，你跟操作系统说：哥们，往磁盘写个数据，操作系统停下手上的活给你写；过一会儿你又说：哥们，往磁盘写个数据……那操作系统什么都不干，刚给你写数据？

那效率太低了。这个时候就要用的缓冲区了

你往磁盘写数据，先往缓冲区上写，缓冲区满了，操作系统再一波往磁盘上写。

所以缓冲区是很有必要的

注意：这波我们学的缓冲区是C语言给我们提供的，也就是说是一个语言层的缓冲区