Linux文件编程：fread/fwrite二进制读写详解-代码聚汇网

Linux文件编程：fread/fwrite二进制读写详解

苏黎世贝勒爷

1. Linux文件编程：深入理解fread/fwrite二进制读写

在Linux系统编程中，文件操作是最基础也是最重要的技能之一。fread和fwrite作为标准C库提供的二进制文件读写函数，相比文本模式读写具有更高的效率和灵活性。我曾在多个嵌入式项目中处理过传感器数据存储，深刻体会到掌握这两个函数的重要性。

二进制文件操作的核心优势在于：

直接内存映射：数据在内存中的二进制形式可以直接写入文件，无需格式转换
结构体友好：可以整体读写结构体数据，特别适合固定格式的数据记录
效率优先：省去了文本解析的开销，尤其适合大数据量场景

2. fread函数详解与应用

2.1 函数原型与参数解析

c复制size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);

这个看似简单的函数声明蕴含着几个关键设计思想：

双重尺寸控制：通过size和nmemb两个参数，既可以控制单次读取的总量，又可以记录读取的元素个数。这种设计在读取结构体数组时特别有用。
缓冲机制：底层采用缓冲I/O，不是每次调用都触发系统调用，这显著提升了频繁小数据量读取的性能。

参数详解：

ptr：数据存储缓冲区。建议预先分配足够空间，否则会导致缓冲区溢出
size：单个元素字节数。常用sizeof运算符获取
nmemb：请求读取的元素数量
stream：文件指针。必须是已打开的二进制文件（带"b"模式）

重要提示：在Linux环境下，"b"模式可以省略，因为Linux不区分文本和二进制模式。但在Windows平台必须明确指定。

2.2 返回值处理的艺术

fread的返回值处理需要特别注意：

c复制size_t ret = fread(buffer, sizeof(struct Student), 10, fp);
if(ret < 10) {
    // 处理不完整读取情况
    if(feof(fp)) {
        printf("到达文件末尾\n");
    }
    if(ferror(fp)) {
        perror("读取错误");
    }
}

典型返回值场景：

成功读取：返回实际读取的元素个数（可能小于请求值）
文件末尾：返回0，需用feof()确认
读取错误：返回0，需用ferror()检查

2.3 结构体读写实战

处理学生信息的经典案例：

c复制struct Student {
    char name[20];
    int age;
    int sno;
    float score;
};

// 写入示例
struct Student stu = {"张三", 20, 1001, 89.5};
fwrite(&stu, sizeof(struct Student), 1, fp);

// 读取示例
struct Student stu_read;
size_t ret = fread(&stu_read, sizeof(struct Student), 1, fp);
if(ret == 1) {
    printf("姓名：%s 年龄：%d\n", stu_read.name, stu_read.age);
}

实际项目中的经验：

结构体对齐问题：不同平台可能有不同对齐方式，建议使用#pragma pack控制
版本兼容性：在结构体中添加版本字段，便于后期格式升级
字节序问题：跨平台传输时需考虑大小端问题

3. fwrite函数深度解析

3.1 函数原型与关键特性

c复制size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream);

fwrite与fread参数对称，但有几个重要区别：

数据流向：从内存到文件
错误处理：返回值小于nmemb通常意味着磁盘已满
缓冲特性：数据可能不会立即写入磁盘，需要fflush()强制写入

3.2 高效写入技巧

批量写入：单次写入多个元素比多次写入效率高得多

c复制// 推荐做法
struct Student class[50];
fwrite(class, sizeof(struct Student), 50, fp);

// 不推荐做法
for(int i=0; i<50; i++) {
    fwrite(&class[i], sizeof(struct Student), 1, fp);
}

缓冲优化：适当设置缓冲区大小可以显著提升性能

c复制char buf[8192];
setvbuf(fp, buf, _IOFBF, sizeof(buf));  // 设置8KB缓冲区

错误恢复：处理磁盘空间不足的情况

c复制size_t to_write = 100;
size_t written = fwrite(data, sizeof(Item), to_write, fp);
if(written < to_write) {
    // 尝试释放空间或提示用户
    perror("写入失败");
    // 可以尝试分批写入剩余数据
}

4. 文件定位与偏移量控制

4.1 文件位置指针的奥秘

每个打开的文件都有一个隐式的"位置指针"，它决定了下一次读写操作的位置。理解这个指针的行为对正确使用fread/fwrite至关重要。

常见误区：

认为读和写使用独立的指针（实际共享同一个）
忽略打开模式的影响（追加模式会强制指向文件末尾）
未考虑二进制和文本模式的差异（文本模式在某些平台有特殊处理）

4.2 定位三剑客：fseek、ftell、rewind

4.2.1 fseek的精妙用法

c复制int fseek(FILE *stream, long offset, int whence);

whence参数的三种模式：

SEEK_SET：从文件开头计算偏移
- 适合随机访问特定位置
- 示例：fseek(fp, sizeof(struct Header), SEEK_SET)
SEEK_CUR：从当前位置计算偏移
- 适合相对移动
- 示例：跳过当前记录 fseek(fp, sizeof(struct Record), SEEK_CUR)
SEEK_END：从文件末尾计算偏移
- 适合追加或逆向读取
- 示例：读取最后一条记录 fseek(fp, -sizeof(struct Record), SEEK_END)

重要提示：在32位系统上，offset类型为long，可能限制大文件操作。对于超过2GB的文件，应使用fseeko64等64位版本。

4.2.2 ftell的实用技巧

c复制long ftell(FILE *stream);

典型应用场景：

记录关键位置以便回溯

c复制long pos = ftell(fp);  // 记录当前位置
// ...其他操作...
fseek(fp, pos, SEEK_SET);  // 回到记录的位置

获取文件大小（需配合SEEK_END）

c复制fseek(fp, 0, SEEK_END);
long filesize = ftell(fp);
rewind(fp);  // 回到文件开头

4.2.3 rewind的等效实现

c复制void rewind(FILE *stream);

等价于：

c复制fseek(fp, 0, SEEK_SET);
clearerr(fp);  // 同时清除错误标志

4.3 空洞文件的实战应用

创建空洞文件是一种预分配磁盘空间的技巧：

c复制FILE *fp = fopen("hollow.dat", "wb");
fseek(fp, 1024*1024 - 1, SEEK_SET);  // 定位到1MB位置
fputc('\0', fp);  // 写入一个字节
fclose(fp);

实际应用场景：

数据库预分配空间
日志文件预留空间
内存映射文件准备

性能考虑：

现代文件系统对稀疏文件支持良好
实际磁盘空间按需分配
可减少文件碎片化

5. 综合实战：学生信息管理系统

5.1 完整写入示例

c复制#include <stdio.h>
#include <string.h>

struct Student {
    char name[20];
    int age;
    int sno;
    float score;
};

void write_students() {
    FILE *fp = fopen("students.dat", "wb");
    if(!fp) {
        perror("打开文件失败");
        return;
    }

    struct Student class[] = {
        {"张三", 20, 1001, 89.5},
        {"李四", 21, 1002, 92.0},
        {"王五", 19, 1003, 78.5}
    };

    size_t count = sizeof(class)/sizeof(class[0]);
    size_t written = fwrite(class, sizeof(struct Student), count, fp);
    
    if(written != count) {
        printf("警告：只写入了%zu条记录\n", written);
    }
    
    fclose(fp);
}

5.2 高级读取技巧

c复制void read_students() {
    FILE *fp = fopen("students.dat", "rb");
    if(!fp) {
        perror("打开文件失败");
        return;
    }

    // 获取记录数量
    fseek(fp, 0, SEEK_END);
    long filesize = ftell(fp);
    size_t count = filesize / sizeof(struct Student);
    rewind(fp);

    // 动态分配内存
    struct Student *class = malloc(filesize);
    if(!class) {
        perror("内存分配失败");
        fclose(fp);
        return;
    }

    // 批量读取
    size_t read = fread(class, sizeof(struct Student), count, fp);
    for(size_t i=0; i<read; i++) {
        printf("学号：%d 姓名：%s 年龄：%d 分数：%.1f\n",
               class[i].sno, class[i].name, class[i].age, class[i].score);
    }

    free(class);
    fclose(fp);
}

5.3 性能优化实践

内存映射替代方案：

c复制#include <sys/mman.h>
#include <fcntl.h>

void mmap_example() {
    int fd = open("students.dat", O_RDONLY);
    if(fd == -1) {
        perror("打开文件失败");
        return;
    }

    struct stat sb;
    if(fstat(fd, &sb) == -1) {
        perror("获取文件信息失败");
        close(fd);
        return;
    }

    struct Student *class = mmap(NULL, sb.st_size, PROT_READ, MAP_PRIVATE, fd, 0);
    if(class == MAP_FAILED) {
        perror("内存映射失败");
        close(fd);
        return;
    }

    size_t count = sb.st_size / sizeof(struct Student);
    for(size_t i=0; i<count; i++) {
        // 直接访问内存数据
    }

    munmap(class, sb.st_size);
    close(fd);
}

错误处理最佳实践：

检查所有I/O操作的返回值
使用perror输出有意义的错误信息
考虑实现重试机制
确保资源释放（文件关闭、内存释放）

6. 高级主题与疑难解答

6.1 常见问题排查

读取数据不正确：
- 检查文件打开模式是否包含"b"
- 验证结构体定义是否一致
- 检查字节序问题（特别是跨平台时）
写入数据丢失：
- 确保调用了fclose()或fflush()
- 检查磁盘空间是否充足
- 验证返回值是否等于请求写入量
性能瓶颈：
- 使用更大的缓冲区
- 减少小数据量的频繁写入
- 考虑使用内存映射文件

6.2 跨平台注意事项

结构体对齐：

c复制#pragma pack(push, 1)  // 1字节对齐
struct PortableStruct {
    // 成员定义
};
#pragma pack(pop)

文件路径：

Windows使用反斜杠，Linux使用正斜杠
考虑使用/作为统一分隔符（Windows也支持）

大文件支持：

使用_FILE_OFFSET_BITS=64定义
使用fseeko/ftello替代fseek/ftell

6.3 安全编程实践

边界检查：

c复制// 不安全的写法
fread(buffer, 1, 1024, fp);

// 安全的写法
if(fread(buffer, 1, min(1024, remaining), fp) != expected) {
    // 错误处理
}

输入验证：

检查文件大小是否合理
验证读取的数据是否符合预期范围
对字符串数据添加终止符

资源管理：

使用RAII模式管理资源
确保所有错误路径都释放资源
考虑使用智能指针（C++）或类似机制

在实际项目中，我曾遇到过一个因未检查fread返回值导致的严重bug：在读取网络传输的文件时，由于网络中断导致部分读取，程序却继续处理了未初始化的缓冲区数据。这个教训让我深刻理解了防御性编程的重要性。