FPGA实战：基于SPI协议实现FLASH存储器的可靠读写

只为媛动心

1. 认识我们的硬件搭档：W25Q16BV FLASH芯片

第一次拿到W25Q16BV这颗FLASH芯片时，我对着数据手册研究了整整一个周末。这颗只有8个引脚的小芯片，内部却藏着2MB的存储空间（16Mbit），相当于可以存储一本《小王子》的完整文本。更妙的是，它通过SPI接口就能完成所有操作，不需要复杂的并行总线。

W25Q16BV内部采用分块管理结构，32个块（Block）组成整个存储空间，每个块64KB。块又细分为16个扇区（Sector），每个扇区4KB。这种层级设计让擦除操作非常灵活——你可以选择擦除整个芯片、单个块或者单个扇区。实际项目中我经常遇到这种情况：只需要修改配置参数时，擦除4KB扇区比整片擦除快得多，还能避免不必要的数据丢失。

芯片的引脚虽然少，但每个都关键：

CS（片选）：拉低时芯片才会响应指令，相当于"点名应答"
CLK（时钟）：SPI通信的节奏指挥官
DI/DO（数据输入/输出）：数据的进出通道
WP/HOLD（写保护/保持）：保护数据安全的双保险

提示：新手常犯的错误是忽略WP引脚，导致无法写入。记得上拉这个引脚，或者直接接到VCC。

2. SPI协议的精要解析

SPI协议就像两个人在打哑谜，需要严格遵守约定的手势规则。在FPGA作为主机的场景下，我们需要特别关注三个关键点：

模式选择是最容易搞混的部分。W25Q16BV支持模式0和模式3，我习惯用模式0（CPOL=0，CPHA=0）。这意味着：

时钟空闲时为低电平
数据在上升沿被采样（相当于时钟的前沿）

用示波器抓取的波形显示，主机（FPGA）在时钟上升沿改变MOSI数据，从机（FLASH）在下降沿输出MISO数据。这种错开半拍的节奏，保证了数据稳定性。我曾用不同模式测试过，发现模式0的时序余量最大，特别适合初学者。

时钟速率也需要权衡。虽然芯片标称支持80MHz，但实际使用中我建议从10MHz开始。过高的时钟会导致信号完整性问题——有次我为了追求速度用50MHz时钟，结果在长排线上出现了数据错位，后来加了33Ω终端电阻才解决。

完整的SPI传输单元包含：

CS拉低（至少保持5ns后开始时钟）
发送8位指令（高位在前）
可选地址段（24位）
数据段（长度可变）
CS拉高（至少保持100ns）

3. 必须掌握的六大核心指令

3.1 写使能（06h）

这是所有修改操作的前置步骤，相当于给芯片"解锁"。有次我调试时发现写入总是失败，后来才发现漏了这条指令。实现时要注意：

verilog复制// 示例代码片段
always @(posedge clk) begin
    if(state == WRITE_ENABLE) begin
        spi_mosi <= cmd_buffer[7];  // 移位输出06h
        cmd_buffer <= {cmd_buffer[6:0], 1'b0}; // 右移
    end
end

完成后需要检查状态寄存器的WEL位，确保写使能真正生效。我习惯在发送指令后延时1us再检查，避免竞争条件。

3.2 整片擦除（C7h）

这是最暴力的操作，相当于格式化整个磁盘。实测需要3-5秒完成，期间BUSY位会保持为1。建议在以下场景使用：

产品出厂前的初始化
固件需要完全更新时
存储结构发生重大变更时

注意：擦除期间如果断电，可能导致数据损坏。重要项目建议加备用电池。

3.3 页编程（02h）

FLASH的写入有个特点：只能把1改成0，不能反过来。所以写入前必须先擦除（把整个区域变成全1）。每个页256字节，超过会回卷到页首。我吃过这个亏——连续写入300字节时，前44字节被后续数据覆盖了。

可靠的写入流程应该是：

发送写使能
发送页编程指令
发送24位地址
发送数据（最多256字节）
等待编程完成（检查BUSY位）

3.4 连续读（03h）

最常用的指令没有之一。可以任意地址开始读取，芯片会自动递增地址。有个优化技巧：连续读时保持CS为低，可以省去重复发送指令的时间。我在读取1MB数据时，这样操作比单次读取快20倍。

3.5 扇区擦除（20h）

我的最爱指令，4KB的擦除粒度非常实用。地址只需要对齐到扇区起始位置（低12位忽略）。典型操作：

verilog复制task sector_erase;
    input [23:0] addr;
    begin
        write_enable();
        send_cmd(8'h20);
        send_addr(addr & 24'hFFFF_F000); // 地址对齐
        wait_busy();
    end
endtask

3.6 读状态寄存器（05h）

这是系统的健康检查工具。除了检查BUSY位，还要关注：

WEL：写使能锁存
BP0-BP2：写保护区域设置
SRP：状态寄存器保护

4. FPGA驱动设计实战

4.1 状态机设计

我设计的状态机包含7个状态，用独热码（one-hot）编码实现：

verilog复制parameter IDLE     = 4'b0001;
parameter WR_EN    = 4'b0010;
parameter SECT_ERA = 4'b0100;
parameter PAGE_PROG= 4'b1000;
// 其他状态省略...

状态转移逻辑要处理好几种超时情况：

擦除超时（>3s）
编程超时（>5ms）
等待状态寄存器超时（>100us）

4.2 时钟域处理

FPGA的100MHz系统时钟需要分频生成SPI时钟。我的做法是：

verilog复制always @(posedge clk_100m) begin
    clk_div <= clk_div + 1;
    spi_clk <= clk_div[1]; // 25MHz时钟
end

实测发现，在CLK下降沿采样MISO数据最稳定。为此我专门做了时钟对齐：

verilog复制assign sample_edge = ~spi_clk & clk_div[0]; // 下降沿中间时刻

4.3 数据缓冲区

采用双缓冲设计提高吞吐量：

前台缓冲：正在发送/接收的数据
后台缓冲：准备下一包数据
用w_data_req信号实现流控，当缓冲区快空时请求新数据。

5. 可靠性增强技巧

5.1 写保护机制

除了硬件WP引脚，软件上我实现了三重保护：

关键区域设置BP保护位
写操作前校验地址范围
重要数据写入后立即回读校验

5.2 错误检测

通过CRC16校验数据完整性。对于256字节数据，校验计算仅增加0.5ms开销，但能避免很多奇怪问题。我的校验模块长这样：

verilog复制crc16 crc_inst (
    .clk(spi_clk),
    .rst(crc_rst),
    .data_in(recv_data),
    .crc_out(crc_result)
);

5.3 掉电保护

突然断电可能导致正在编程的页损坏。我的解决方案：

关键数据分散存储在不同块
每个数据包包含版本号和校验码
上电时自动检查并恢复最新有效数据

6. 性能优化实战

6.1 批量操作提速

连续写入多页数据时，可以保持写使能状态：

首次发送WREN
循环发送PP+地址+数据
仅最后等待一次BUSY
这样操作1KB数据，时间从12ms降到8ms。

6.2 缓存策略

在FPGA内实现256字节的写缓存：

积累满一页再实际写入
非连续地址自动触发写入
断电前强制刷盘

6.3 并行操作

双SPI（Dual SPI）模式下，DI/DO引脚可以同时传输数据，速度翻倍。需要修改指令：

verilog复制localparam FAST_READ = 8'h0B;  // 快速读指令

7. 调试经验分享

第一次调试时，我用逻辑分析仪抓取了完整时序（建议使用Saleae或PulseView）。常见的坑有：

CS信号抖动：导致误判指令开始

解决方法：在FPGA内部对CS信号做消抖

verilog复制always @(posedge clk) begin
    cs_sync <= {cs_sync[1:0], spi_cs};
    if(&cs_sync[2:1]) cs_clean <= 1'b0;
    else if(|cs_sync[2:1]) cs_clean <= 1'b1;
end

时钟偏移问题：长走线导致时钟相位偏移
- 解决方法：PCB上加串联电阻，或降低时钟频率
电源噪声干扰：导致写入异常
- 解决方法：在VCC引脚加0.1μF+10μF去耦电容

最有效的调试方法是分阶段验证：

先确保能正确读取芯片ID（EFh）
再测试状态寄存器读写
然后尝试扇区擦除
最后实现页编程和连续读

记得在代码中加入调试接口，通过LED或UART输出关键状态。我的调试模块通常会输出：

当前操作状态
错误计数器
最后一次操作地址

已经到底了哦

精选内容

1 库存优化避坑指南：为什么你的EOQ模型总算不准？这5个参数90%的人设错了 2 Unity角色裙子飘动太假？用Magica Cloth做个真实物理裙摆（附完整配置流程）3 UCIe Sideband流控实战：从FDI接口信号到Link层Crd字段，手把手解析芯片内部数据流管理 4 STM32CubeMX实战：基于PID差速算法的智能循迹小车设计与实现 5 你的HC-05蓝牙模块吃灰了？试试用STM32做个无线调试终端和简单数据透传 6 【车载开发实战】Autosar DCM诊断通信管理：核心交互与配置精解 7 避坑指南：在联想ThinkBook 14+ 2023上装双系统，我踩过的这些雷希望你不用再踩 8 超越简单堆叠：将注意力机制深度集成到YOLOv8的C2f模块中 9 Ubuntu 24.04 LTS Server 从零到一：手把手详解安装与核心配置 10 ForkJoinPool实战：从并行数组求和到大数据处理的性能跃迁