FPGA实战：手把手教你用Verilog驱动BPI FLASH（S29GL系列）完成擦除与编程

froggengo

FPGA实战：Verilog驱动BPI FLASH（S29GL系列）的工程化实现

在嵌入式存储开发中，BPI FLASH因其高可靠性和并行接口优势，成为FPGA项目中的常见存储方案。本文将聚焦S29GL128P芯片，通过Verilog代码实例演示如何实现擦除、编程和读取功能。不同于理论分析，我们更关注工程落地中的状态机设计、时序处理以及调试技巧，帮助开发者快速集成到Xilinx或Intel平台项目中。

1. 硬件接口与工程准备

1.1 BPI FLASH硬件连接

S29GL系列BPI FLASH典型接口包含16位数据总线、22位地址总线及控制信号线。在FPGA工程中需正确定义引脚约束：

verilog复制// Xilinx约束示例
set_property PACKAGE_PIN T12 [get_ports {flash_addr[0]}]
set_property IOSTANDARD LVCMOS33 [get_ports {flash_addr[*]}]
set_property PACKAGE_PIN M15 [get_ports {flash_data[0]}]
set_property IOSTANDARD LVCMOS33 [get_ports {flash_data[*]}]
set_property PACKAGE_PIN R10 [get_ports flash_ce_n]
set_property IOSTANDARD LVCMOS33 [get_ports flash_ce_n]

关键信号说明：

信号名称	方向	描述
CE#	输出	片选信号（低有效）
OE#	输出	输出使能（低有效）
WE#	输出	写使能（低有效）
RY/BY#	输入	就绪/忙状态指示

1.2 工程目录结构

推荐采用模块化设计，典型工程结构如下：

code复制bpi_flash_driver/
├── rtl/
│   ├── flash_ctrl.v      // 顶层控制模块
│   ├── flash_fsm.v       // 状态机核心
│   └── flash_io.v        // 物理接口处理
├── sim/
│   └── tb_flash_ctrl.v   // 测试平台
└── constraints/
    └── flash.xdc         // 引脚约束文件

2. 状态机设计与命令序列

2.1 基础状态机架构

BPI FLASH操作本质上是命令序列的状态转换。建议采用三段式状态机实现：

verilog复制// flash_fsm.v 片段
parameter [3:0] IDLE      = 4'd0,
                CMD_START  = 4'd1,
                WR_DATA    = 4'd2,
                WAIT_RB    = 4'd3,
                ...

always @(posedge clk or posedge rst) begin
    if(rst) begin
        state <= IDLE;
    end else begin
        case(state)
            IDLE: 
                if(start_erase) state <= CMD_START;
                ...
            
            CMD_START: 
                if(cmd_cnt == 6'd5) state <= WAIT_RB;
                ...
        endcase
    end
end

2.2 扇区擦除实现

S29GL的擦除操作需要严格遵循6步命令序列：

0x555 ← 0xAA
0x2AA ← 0x55
0x555 ← 0x80
0x555 ← 0xAA
0x2AA ← 0x55
目标扇区地址 ← 0x30

Verilog实现关键代码：

verilog复制// 擦除命令序列生成
always @(*) begin
    case(cmd_step)
        0: begin
            flash_addr = 16'h0555;
            flash_data = 16'h00AA;
            we_n = 1'b0;
        end
        ...
        5: begin
            flash_addr = sector_addr;
            flash_data = 16'h0030;
            we_n = 1'b0;
        end
    endcase
end

注意：每个写周期需要满足tWC时间（典型值35ns），建议插入至少2个时钟周期的等待状态

3. 编程操作实战技巧

3.1 单字编程模式

对于少量数据写入，推荐使用单字编程模式：

verilog复制// 单字编程状态机片段
parameter PROG_CMD1 = 4'd6,
          PROG_CMD2 = 4'd7,
          PROG_DATA = 4'd8;

always @(posedge clk) begin
    case(state)
        PROG_CMD1: begin
            flash_addr <= 16'h0555;
            flash_data <= 16'h00AA;
            we_n <= 1'b0;
            next_state <= PROG_CMD2;
        end
        PROG_DATA: begin
            flash_addr <= target_addr;
            flash_data <= write_data;
            we_n <= 1'b0;
            next_state <= WAIT_RB;
        end
    endcase
end

3.2 缓冲区编程优化

当需要写入大量连续数据时，缓冲区编程可显著提升效率：

发送0x25命令启动缓冲编程
写入字计数（实际值-1）
连续写入数据到缓冲区
发送0x29确认写入

典型时序控制代码：

verilog复制// 缓冲区写入控制
reg [8:0] buf_cnt;
always @(posedge clk) begin
    if(state == BUF_WRITE && we_n) begin
        if(buf_cnt == word_count) begin
            state <= BUF_CONFIRM;
        end else begin
            buf_cnt <= buf_cnt + 1;
            flash_addr <= base_addr + buf_cnt;
            flash_data <= data_fifo[buf_cnt];
            we_n <= 1'b0;
        end
    end
end

4. 操作状态检测机制

4.1 RY/BY#引脚检测

最直接的状态检测方式是通过硬件引脚：

verilog复制// RY/BY#状态检测模块
module rb_detector(
    input clk,
    input rb_n,          // 来自FLASH的RY/BY#信号
    output reg ready
);

always @(posedge clk) begin
    ready <= rb_n;       // 注意实际需要反相处理
end

endmodule

提示：实际PCB设计中需确保RY/BY#引脚配置上拉电阻（典型值10kΩ）

4.2 软件轮询方案

当硬件引脚不可用时，可采用数据轮询方式：

verilog复制// 轮询状态检测
task poll_status;
    input [15:0] addr;
    begin
        do begin
            read_flash(addr, rd_data);
        end while(rd_data[7] != 1'b1); // 检查DQ7位
    end
endtask

关键状态位说明：

位	名称	含义
DQ7	DATA#	写入数据取反指示
DQ6	TOGGLE	切换位（操作中变化）
DQ5	EXCEED	时间超出标志

5. 调试与性能优化

5.1 ILA调试技巧

在Vivado中设置触发条件抓取关键信号：

tcl复制# 创建ILA核
create_debug_core u_ila_0 ila
set_property C_DATA_DEPTH 8192 [get_debug_cores u_ila_0]
set_property C_TRIGIN_EN false [get_debug_cores u_ila_0]

# 添加触发信号
set_property port_width 16 [get_debug_ports u_ila_0/probe0]
set_property PROBE_TYPE DATA_AND_TRIGGER [get_debug_ports u_ila_0/probe0]
connect_debug_port u_ila_0/probe0 [get_nets flash_data]

典型调试场景配置：

设置WE#下降沿触发
捕获完整命令序列
检查地址/数据时序对齐

5.2 时序优化策略

提升FLASH操作效率的关键方法：

流水线设计：重叠命令发送与状态检测
预取机制：提前读取下一操作地址
批量操作：优先使用缓冲区编程模式

性能对比数据：

操作模式	单字耗时	256字耗时	加速比
单字编程	25μs	6400μs	1x
缓冲编程	-	1200μs	5.3x

6. 常见问题解决方案

6.1 擦除验证失败处理流程

当擦除验证异常时，建议按以下步骤排查：

确认电源电压稳定（VCC=3.3V±5%）
检查写保护信号（WP#）状态
重新读取器件ID验证基本通信
使用逻辑分析仪捕获实际时序

6.2 编程异常处理

典型编程问题及解决方法：

数据位错误：
- 检查PCB走线等长
- 增加IO约束输出延迟
操作超时：
- 确认RY/BY#上拉有效
- 延长超时阈值（典型值10ms）
间歇性失败：
- 插入写周期后的稳定时间
- 降低时钟频率调试

verilog复制// 超时计数器实现
reg [23:0] timeout_cnt;
always @(posedge clk) begin
    if(state != WAIT_RB) begin
        timeout_cnt <= 24'd0;
    end else begin
        timeout_cnt <= timeout_cnt + 1;
        if(timeout_cnt > 24'd10_000_000) begin
            error <= 1'b1;
            state <= IDLE;
        end
    end
end