C语言-7-文件操作
什么是文件及文件类型
文件可以分为程序文件和数据文件。
1.程序文件,包括源程序文件(.c)、目标文件(windows平台下为.obj)和可执行文件(windows平台下为.exe)
2.数据文件,包括程序运行时所需要从中读取数据的文件,或者需要向其中写入数据的文件。根据数据的组织形式,数据文件又可以分为文本文件和二进制文件
我们都知道,数据在内存中以二进制的形式进行存储,如果不加以转换直接输入到外存,这种形式的存储文件就是二进制文件;而如果要求数据在外存中以ASCII码的形式存在,则需要在存储前在内存中进行转换,我们说,以ASCII码的形式存储数据的文件就是文本文件。
这就要提到数据在内存中的存储形式了。字符一律以ASCII码的形式存储,而数值型数据既可以是二进制的形式,也可以是ASCII码的形式。
今有整数8848,我们来探究一下8848分别以ASCII和二进制的形式在内存中究竟是怎么存储的,请看图一:
下面,我们以代码的形式来展示如何将8848以二进制的形式写入到数据文件当中,请看代码一:
1 | //代码一 |
运行代码后,我们首先打开对应的test.txt文件,发现是人类无法读懂的机器码,如图二:
于是,我们用VS2019自带的二进制编辑器打开test.txt文件,如图三、四:
图四中的数是小端存储的16进制数,故为
1 | 0x00002290 |
即为十进制
1 | 8848 |
文件名
一个文件需要一个唯一的文件标识,以便用户识别和引用。
文件名包含三个部分:文件路径、文件名主干、文件后缀
例如:
1 | C:\Users\imdan\test.c |
为了方便起见,文件标识通常被叫做文件名
文件缓冲区
文件缓冲区是用以暂时存放读写期间的文件数据而在内存区预留的一定空间。
使用文件缓冲区可减少读取硬盘的次数。
文件缓冲区是用以暂时存放读写期间的文件数据而在内存区预留的一定空间。
请看图五:
文件指针
在C语言中,每个被使用的文件在内存中都会被开辟一块文件信息区用来存放这个文件的各种信息(名字,状态,位置等),我们用一个结构体变量来保存这些信息:
1 | typedef struct |
该结构体被命名为FILE
用一个指针变量指向这个文件信息区,这个指针称为文件指针。通过文件指针就可对它所指的文件进行各种操作。
1 | FILE* fp; |
在这里,fp就是一个文件指针变量,我们通过fp指针找到文件信息区,通过文件信息区中的信息访问文件。也就是说,通过fp能找到我们要访问的文件。如图六:
文件的打开与关闭
我们在读写文件之前应该先打开文件,结束之后应该关闭文件。
我们来看函数fopen与fclose的参数与返回值:
1 | FILE *fopen( const char *filename, const char *mode ); |
对于fopen,我们需要传入的参数是文件名(Filename)和 存取文件的类型(Type of access permitted),而返回值是一个FILE*的指针。特别地,如果打开文件失败,会返回NULL。
1 | int fclose( FILE *stream ); |
对于fclose,我们需要传入的参数是FILE*的指针,如果关闭文件成功,返回0;关闭失败,返回EOF。
下面,让我们来看一下fopen中的第二个参数mode究竟有哪些(见表一)
文件使用方式 | 含义 | 如果指定文件不存在 |
---|---|---|
“r”(只读) | 为了输入数据,打开一个已经存在的文本文件 | 出错 |
“w”(只写) | 为了输出数据,打开一个文本文件 | 建立一个新的文件 |
“a”(追加) | 向文本文件尾添加数据 | 出错 |
“rb”(只读) | 为了输出数据,打开一个二进制文件 | 出错 |
“wb”(只写) | 为了输出数据,打开一个二进制文件 | 建立一个新的文件 |
“ab”(追加) | 向一个二进制文件尾添加数据 | 出错 |
“r+”(读写) | 为了读和写,打开一个文本文件 | 出错 |
“w+”(读写) | 为了读和写,建立一个新的文件 | 建立一个新的文件 |
“a+”(读写) | 打开一个文件,在文件尾进行读写 | 建立一个新的文件 |
“rb+”(读写) | 为了读和写,打开一个二进制文件 | 出错 |
“wb+”(读写) | 为了读和写建立一个新的二进制文件 | 建立一个新的文件 |
“ab+”(读写) | 为了读和写,在文件尾进行读和写 | 建立一个新的文件 |
接下来,让我们举一个小例子。我们想把"helloworld"这个字符串写入test.txt的文件中。请看代码二:
1 | //代码二 |
文件的顺序读写
下面,我们来介绍一些与文件读写有关的函数(见表二)
|功能|函数名|适用范围|定义|
|–|–|–|–|
|字符输入函数|fgetc|所有输入流|int fgetc( FILE *stream );|
|字符输出函数|fputc|所有输出流|int fputc( int c, FILE *stream );|
|文本行输入函数|fgets|所有输入流|char *fgets( char *string, int n, FILE *stream );|
|文本行输出函数|fputs|所有输出流|int fputs( const char *string, FILE *stream );|
|格式化输入函数|fscanf|所有输入流|int fscanf( FILE *stream, const char *format [, argument ]… );|
|格式化输出函数|fprintf|所有输出流|int fprintf( FILE *stream, const char *format [, argument ]…);|
|从字符串读取格式化输入|sscanf|字符串|int sscanf( const char *buffer, const char *format [, argument ] … );|
|将格式化输出写入字符串|sprintf|字符串|int sprintf( char *buffer, const char *format [, argument] … );|
|二进制输入|fread|文件|size_t fread( void *buffer, size_t size, size_t count, FILE *stream );|
|二进制输出|fwrite|文件|size_t fwrite( const void *buffer, size_t size, size_t count, FILE *stream );|
文件的随机读写
下面,我们来继续介绍几个有关文件随机读写的函数,fseek、ftell以及rewind。
fseek
将文件指针移动到指定位置
1 | int fseek( FILE *stream, long offset, int origin ); |
stream表示流,是一个FILE*的指针
offset表示偏移量(单位是字节),1代表向后偏移一个字节,-1代表向前偏移一个字节
origin表示起始位置,有三种:SEEK_CUR(当前文件指针指向的位置) SEEK_END(文件结尾) SEEK_SET(文件开头)
ftell
返回当前文件指针的位置,即相对于文件开始时的偏移量
1 | long ftell( FILE *stream ); |
rewind
将文件指针重置到文件开始位置
请看代码三的演示,我们将fseek、ftell、rewind综合使用:
1 | //代码三 |
运行结果见图七:
文件结束判定
1 | int feof( FILE *stream ); |
在文件读取结束的时候,我们使用feof函数来判断文件是因为读取失败结束还是遇到文件尾结束
关于feof的返回值,如果文件正常结束即文件指针指向文件尾,返回非零值;如果结束时文件指针没有指向文件结尾,返回0
需要强调的是,feof函数只能用来判断文件是以什么方式结束,而不能用来判断文件是否结束
我们能够明白为什么feof不能用来判断文件是否结束,若我们错误地以feof的返回值来判断文件是否结束,若返回值为0,你以为是文件还没有结束,但是若当文件出错结束时,结果就和文件未结束一样,都会返回0
所以,我们要用其他方式首先判断文件是否已经结束,然后才能用feof来判断文件究竟以什么方式结束的
文本文件
文本文件读取是否结束,判断返回值为EOF(fgetc),或者NULL(fgets)
在文件已经结束时,fgetc判断以何种方式结束的方法是判断返回值是否为EOF(EOF to indicate an error or end of file)
在文件已经结束时,fgets判断以何种方式结束的方法是是判断返回值否为NULL(NULL is returned to indicate an error or an end-of-file condition.)
请看代码四:
我们事先创建一个test.txt文件,并在其中写入helloworld的内容
1 | //代码四 |
运行结果
二进制文件
二进制文件的读取结束的判断为返回值是否小于实际要读的个数,请看代码五:
1 |
|
运行结果见图九: