Linux内核5.4下SD卡驱动开发实战:从mmc_blk_probe到块设备注册全流程解析

Aowandowski

Linux内核5.4下SD卡驱动开发实战:从mmc_blk_probe到块设备注册全流程解析

在嵌入式Linux开发中,SD卡作为最常用的存储介质之一,其驱动实现机制一直是开发者需要深入理解的核心内容。本文将带你深入Linux内核5.4版本中SD卡驱动的实现细节,从mmc_blk_probe函数开始,逐步剖析块设备创建的完整流程,包括关键数据结构如request_queue、gendisk的作用机制,以及mmc_blk_alloc等核心函数的实现原理。

1. Linux块设备驱动框架概述

Linux块设备驱动架构是一个多层次的系统,从文件系统到物理设备之间经过了多个抽象层的处理。理解这个架构对于开发SD卡驱动至关重要。

核心层次结构

  • 文件系统层:如ext4、FAT32等,负责文件的组织和管理
  • 通用块层(Generic Block Layer):处理块I/O请求的抽象
  • I/O调度层:优化请求顺序,提高磁盘访问效率
  • 块设备驱动层:直接与硬件交互的具体实现

在SD卡驱动中,这个流程具体表现为:

code复制文件系统 → 通用块层 → I/O调度层 → mmc_blk层 → mmc core层 → mmc host层 → SD卡硬件

每个层次都有其关键数据结构:

层次 关键数据结构 作用描述
通用块层 struct bio 表示一个块I/O操作
I/O调度层 struct request 封装bio的请求
I/O调度层 struct request_queue 管理请求队列
块设备驱动层 struct gendisk 表示一个磁盘设备

2. MMC子系统驱动模型分析

MMC子系统是Linux内核中管理MMC/SD卡的核心框架,它采用了标准的Linux设备驱动模型。在SD卡驱动中,mmc_driver是最上层的驱动结构。

c复制static struct mmc_driver mmc_driver = {
    .drv = {
        .name = "mmcblk",
        .pm = &mmc_blk_pm_ops,
    },
    .probe = mmc_blk_probe,
    .remove = mmc_blk_remove,
    .shutdown = mmc_blk_shutdown,
};

驱动注册过程发生在mmc_blk_init函数中:

  1. 注册RPMB总线类型
  2. 分配字符设备区域
  3. 注册块设备主设备号(MMC_BLOCK_MAJOR)
  4. 将mmc_driver注册到mmc_bus上

当SD卡插入时,内核会检测到设备并调用mmc_blk_probe函数,这是整个驱动初始化的起点。

3. mmc_blk_probe函数深度解析

mmc_blk_probe是SD卡驱动初始化的核心函数,它主要完成以下工作:

  1. 设备验证:检查卡是否支持块读写操作
  2. 工作队列创建:分配mmc_complete工作队列
  3. 块设备分配:调用mmc_blk_alloc分配和初始化块设备结构
  4. 分区处理:为可能的多个物理分区分配资源
  5. 设备注册:通过mmc_add_disk将gendisk注册到系统

让我们重点看一下关键代码流程:

c复制static int mmc_blk_probe(struct mmc_card *card)
{
    // 1. 检查卡是否支持块设备操作
    if (!(card->csd.cmdclass & CCC_BLOCK_READ))
        return -ENODEV;
    
    // 2. 创建工作队列
    card->complete_wq = alloc_workqueue("mmc_complete", WQ_MEM_RECLAIM | WQ_HIGHPRI, 0);
    
    // 3. 分配和初始化块设备结构
    md = mmc_blk_alloc(card);
    if (IS_ERR(md))
        return PTR_ERR(md);
    
    // 4. 处理分区
    if (mmc_blk_alloc_parts(card, md))
        goto out;
    
    // 5. 关联设备和数据
    dev_set_drvdata(&card->dev, md);
    
    // 6. 注册块设备
    if (mmc_add_disk(md))
        goto out;
    
    // ... 其他处理 ...
}

这个函数中有两个关键子函数需要特别关注:mmc_blk_alloc和mmc_add_disk,它们分别负责块设备结构的分配和系统注册。

4. mmc_blk_alloc实现机制

mmc_blk_alloc函数是块设备创建的核心,它主要完成以下工作:

  1. 计算SD卡容量(以扇区为单位)
  2. 分配mmc_blk_data结构体
  3. 初始化mmc_queue和request_queue
  4. 创建并设置gendisk结构
  5. 关联各种数据结构

容量计算对于SD卡和eMMC有所不同:

c复制if (!mmc_card_sd(card) && mmc_card_blockaddr(card)) {
    // eMMC设备从ext_csd寄存器获取容量
    size = card->ext_csd.sectors;
} else {
    // SD卡从CSD的capacity域获取容量
    size = (typeof(sector_t))card->csd.capacity << (card->csd.read_blkbits - 9);
}

关键数据结构初始化流程

  1. 分配mmc_blk_data结构体
  2. 设置只读属性
  3. 分配gendisk结构体
  4. 初始化mmc_queue
  5. 创建request_queue
  6. 设置gendisk属性并关联request_queue

其中,mmc_init_queue函数负责队列的初始化和request_queue的创建:

c复制int mmc_init_queue(struct mmc_queue *mq, struct mmc_card *card)
{
    // 初始化标签集
    mq->tag_set.ops = &mmc_mq_ops;
    mq->tag_set.queue_depth = MMC_QUEUE_DEPTH;
    // ... 其他初始化 ...
    
    // 创建request_queue
    mq->queue = blk_mq_init_queue(&mq->tag_set);
    
    // 设置队列属性
    blk_queue_rq_timeout(mq->queue, 60 * HZ);
    mmc_setup_queue(mq, card);
    
    return 0;
}

5. mmc_add_disk与块设备注册

mmc_add_disk函数负责将准备好的gendisk结构注册到系统中,使得用户空间可以通过设备节点访问SD卡。其主要工作包括:

  1. 调用device_add_disk注册gendisk
  2. 创建设备属性文件(如force_ro)
  3. 处理特殊分区(如RPMB)的只读锁定
c复制static int mmc_add_disk(struct mmc_blk_data *md)
{
    // 注册gendisk
    device_add_disk(md->parent, md->disk, NULL);
    
    // 创建force_ro属性文件
    ret = device_create_file(disk_to_dev(md->disk), &md->force_ro);
    
    // 处理启动分区的只读锁定
    if ((md->area_type & MMC_BLK_DATA_AREA_BOOT) && 
        card->ext_csd.boot_ro_lockable) {
        // ... 创建ro_lock属性文件 ...
    }
    
    return ret;
}

注册成功后,系统中会出现对应的块设备节点(如/dev/mmcblk0),用户空间程序就可以通过这个设备节点访问SD卡了。

6. 请求处理机制分析

SD卡的I/O请求处理是整个驱动中最关键的部分之一。当用户空间发起读写操作时,请求会经过以下流程:

  1. 文件系统将请求转换为bio结构
  2. 通用块层将bio封装为request
  3. I/O调度层将request加入队列
  4. 驱动从队列获取并处理request

在MMC子系统中,请求处理由mmc_mq_ops结构体定义的操作集完成:

c复制static const struct blk_mq_ops mmc_mq_ops = {
    .queue_rq = mmc_mq_queue_rq,
    .init_request = mmc_mq_init_request,
    .exit_request = mmc_mq_exit_request,
    .complete = mmc_blk_mq_complete,
    .timeout = mmc_mq_timed_out,
};

其中,mmc_mq_queue_rq是实际处理请求的核心函数,它会:

  1. 从request中提取命令和数据
  2. 通过mmc_host接口发送到底层硬件
  3. 处理完成中断和回调

7. 实际开发中的关键问题与调试技巧

在开发SD卡驱动时,经常会遇到各种问题。以下是一些常见问题及解决方法:

常见问题排查表

问题现象 可能原因 解决方法
无法检测到SD卡 电源或时钟未正确配置 检查host控制器的初始化
读写速度慢 时钟频率设置过低 调整host控制器的时钟配置
数据损坏 DMA缓冲区未对齐 确保DMA缓冲区按cache line对齐
随机挂起 中断处理不当 检查中断处理函数的超时机制

调试技巧

  1. 使用动态调试打印:
bash复制echo -n 'file drivers/mmc/* +p' > /sys/kernel/debug/dynamic_debug/control
  1. 分析请求队列状态:
c复制// 在驱动代码中添加队列状态检查
blk_dump_rq_flags(mq->queue, "Queue status");
  1. 使用ftrace跟踪请求流程:
bash复制echo 1 > /sys/kernel/debug/tracing/events/mmc/enable
cat /sys/kernel/debug/tracing/trace_pipe

在实际项目中,理解这些底层机制可以帮助开发者快速定位和解决复杂的驱动问题,特别是在需要对标准驱动进行定制修改时。

内容推荐

不止于Synergy:Windows 11/10自带功能+SMB3实现更安全的双机文件共享与键鼠控制方案
本文详细介绍了如何利用Windows 11/10自带功能与SMB3协议实现安全的双机文件共享和键鼠控制,无需依赖第三方工具如Synergy。通过原生键鼠共享方案和SMB 3.0文件共享,用户可以在办公环境中实现高效、安全的跨设备协作,同时降低安全风险和维护成本。
QGC参数表实战指南:从电池校准到飞行安全的关键配置
本文详细解析QGC参数表在无人机调试中的关键作用,涵盖电池校准、飞行安全配置等实战技巧。通过调整BAT_V_LOAD_DROP等核心参数,提升电池管理精度和飞行稳定性,适用于农业植保、航拍等多种场景。掌握这些参数配置方法,可显著提高无人机作业安全性和效率。
绕过fakebook的SQL注入过滤:union//select与load_file读文件的几种骚操作
本文深入探讨了在CTF比赛中绕过fakebook的SQL注入过滤的进阶技巧,重点介绍了使用union//select和load_file函数读取文件的方法。通过分析过滤机制、测试回显位置和利用特殊语法,帮助参赛者有效突破防御,获取关键信息。文章还提供了自动化脚本和序列化对象读取文件的实用技巧,适合中高级CTF选手提升实战能力。
Markdown 图片布局与尺寸控制的进阶实践
本文深入探讨了Markdown图片布局与尺寸控制的进阶实践,涵盖了基础语法差异、跨平台兼容的HTML方案、响应式图片设计以及高级应用场景。通过具体代码示例和实用技巧,帮助开发者在不同平台实现精准的图片控制,提升文档和博客的专业性与可读性。
RK3588项目实战:手把手教你搞定AIC8800无线驱动的Buildroot集成与调试
本文详细介绍了在RK3588平台上集成AIC8800无线驱动的全流程,包括硬件准备、Buildroot系统配置、驱动加载调试及性能优化。通过实战案例和代码示例,帮助开发者高效完成无线驱动移植,解决常见问题,提升系统稳定性。
SAP财务凭证实战:如何用Coding Block添加自定义字段(附ABAP代码)
本文详细介绍了如何在SAP财务凭证中使用Coding Block添加自定义字段,包括技术架构理解、字段创建与配置、屏幕逻辑控制、BADI增强实现业务逻辑等实战内容。通过ABAP代码示例和常见问题排查指南,帮助开发者高效实现财务会计凭证的客户化字段扩展,满足复杂业务需求。
uniapp中高效提取视频首帧的两种实战方案
本文详细介绍了在uniapp中高效提取视频首帧的两种实战方案:利用OSS云服务直接截取和通过RenderJS结合Canvas动态绘制。OSS方案简单高效,适合H5和App端,而RenderJS方案则更适合处理特殊视频格式。文章还对比了两种方案的兼容性、性能与成本,并提供了特殊场景处理技巧和最佳实践建议,帮助开发者快速实现视频封面提取功能。
<实战解析>H264/H265码流NALU单元结构详解与MP4封装实战(附完整C语言源码)
本文详细解析了H264/H265码流的NALU单元结构,包括帧类型、头信息解析及MP4封装实战。通过C语言源码示例,帮助开发者深入理解视频编码原理,掌握从码流解析到MP4封装的全流程技术要点,提升视频处理能力。
CH376实战笔记:从SPI驱动到U盘文件系统的嵌入式集成
本文详细介绍了CH376芯片在嵌入式系统中的实战应用,从SPI驱动到U盘文件系统的集成。通过硬件连接、软件SPI驱动实现、固件移植及文件系统操作等步骤,帮助开发者快速掌握CH376在数据读写中的高效应用,特别适合资源受限的MCU项目。
51单片机OLED显示进阶:自己动手做个小菜单和动画效果
本文详细介绍了如何在51单片机上实现OLED显示的高级功能,包括多级菜单系统的架构设计、帧动画原理与实现技巧,以及图形绘制优化方法。通过具体的代码示例和实战案例,帮助开发者打造炫酷的菜单导航和生动的动画效果,提升嵌入式系统的用户界面体验。
如何精准测试海外服务器在全球各地的访问性能?
本文详细介绍了如何精准测试海外服务器在全球各地的访问性能,包括延迟、带宽和路由质量等关键指标。通过使用Ping、Traceroute、Speedtest和iperf3等工具,结合全球节点模拟测试,帮助用户发现并解决跨境网络瓶颈问题,提升海外服务器的访问速度。
你的FPGA数字钟只能亮灯报时?试试用蜂鸣器模块实现整点‘滴滴’声(基于Quartus II)
本文详细介绍了如何利用FPGA驱动蜂鸣器模块为数字钟添加整点报时音效,从硬件连接到PWM音调生成的完整实现过程。通过Quartus II开发环境,开发者可以轻松将单调的LED报时升级为可编程的'滴滴'声,提升交互体验。文章包含硬件选型、电路设计、Verilog代码实现及调试技巧,是FPGA数字钟课程设计的实用进阶指南。
Windows 10下用YOLOv3+Deep_Sort_Pytorch实现多目标跟踪的完整配置指南(含CUDA版本避坑)
本文详细介绍了在Windows 10系统下配置YOLOv3与Deep_Sort_Pytorch实现多目标跟踪的完整流程,重点解决了CUDA版本选择、依赖安装及Windows特有编译问题。通过实战演示和性能优化技巧,帮助开发者高效搭建跟踪系统,并提供了进阶应用与自定义训练方案。
git pull --rebase:如何用它打造一条清晰、线性的提交历史?
本文深入解析`git pull --rebase`的使用方法及其在维护清晰、线性提交历史中的优势。通过对比`git merge`与`git rebase`的工作机制,提供详细的操作流程和冲突解决技巧,帮助开发者优化版本控制策略。文章还探讨了rebase的适用场景与注意事项,是提升Git使用效率的实用指南。
从SteamDB免费游戏数据到个人订阅服务:一个混合爬虫策略的实战复盘
本文详细介绍了如何通过混合爬虫策略(结合Selenium和Requests)高效爬取SteamDB免费游戏数据,并构建个人订阅服务。文章分享了Cookie获取与维护、请求失败重试机制等关键技术细节,以及从脚本到服务的架构演进过程,包括数据库设计优化和定时任务实现。
Ubuntu下VSCode + OpenOCD + Cortex-Debug:一站式STM32开发环境搭建与高效调试实战
本文详细介绍了在Ubuntu系统下使用VSCode、OpenOCD和Cortex-Debug搭建STM32开发环境的完整流程。从基础工具链安装到高级调试技巧,涵盖编译、烧录和调试全流程,特别适合嵌入式开发者提升工作效率。文章还提供了Makefile和CMake配置示例,以及常见问题排查方法,帮助开发者快速构建高效的开源STM32开发环境。
YOLOv8+DeepSORT实战:如何用两个检测模型(人+物)构建银行监控多目标跟踪系统
本文详细介绍了如何利用YOLOv8和DeepSORT构建银行监控多目标跟踪系统,通过双检测模型(人+物)实现高精度跟踪。文章涵盖系统架构设计、关键技术实现、性能优化及部署实践,特别针对银行场景中的遮挡处理和跨类别ID管理提供了解决方案。
告别模拟器限制:为ARM Linux主机(如树莓派)编译Android SDK中的aapt,实现真机级开发测试
本文详细介绍了如何在ARM Linux设备(如树莓派)上编译Android SDK中的aapt工具,实现真机级开发测试。通过环境准备、源码获取、配置修改和选择性编译等步骤,帮助开发者克服传统模拟器限制,在ARM架构上搭建完整的Android开发环境。
告别手动配依赖!用自研SQL解析器为Airflow/Azkaban自动生成血缘与调度任务
本文介绍了如何通过自研SQL解析器自动生成血缘关系与调度任务,告别手动配置依赖的繁琐过程。详细解析了SQL血缘解析的技术原理、调度系统集成方法及生产环境落地实践,帮助数据工程师提升工作效率,减少配置错误。
从零到一:手撸一个让产品经理点赞的 API 文档生成器
本文详细介绍了如何从零开始开发一个自动化API文档生成器,解决传统手工维护文档的时效性差、准确性低和维护成本高等问题。通过Python生态中的FastAPI、LibCST和Jinja2等工具,实现代码到文档的智能转换,并提供了让产品经理易懂的Markdown模板。文章还包含实战搭建指南和进阶技巧,帮助开发者高效生成和维护API文档。
已经到底了哦
精选内容
热门内容
最新内容
PointNet++最远点采样优化指南:如何用PyTorch实现FPS算法提速300%(含CUDA内存管理陷阱)
本文详细解析了PointNet++中最远点采样(FPS)算法的优化策略,通过矩阵运算替代循环、并行化采样和显存管理三重优化,实现300%的速度提升。特别针对PyTorch实现中的CUDA内存管理陷阱提供了解决方案,帮助开发者在三维点云处理中显著提升效率。
51单片机点阵显示避坑指南:Proteus仿真极性测试与取模软件设置详解
本文详细解析了51单片机点阵显示中的常见问题与解决方案,包括Proteus仿真中的极性测试、取模软件设置优化以及扫描算法调试。通过实战案例和代码示例,帮助开发者避免镜像、反白等显示异常,提升点阵显示效果。特别适用于需要显示字符、数字和汉字的51单片机项目开发。
告别卡顿花屏:RK3568 Rockit硬解码与Qt界面叠加显示的完整配置流程
本文详细介绍了在RK3568平台上实现视频硬解码与Qt界面融合显示的完整配置流程。通过对比不同硬件解码方案,重点推荐Rockit框架,提供环境配置、Qt透明窗口设置及常见问题解决方案,帮助开发者高效解决卡顿花屏问题,实现流畅的视频播放与界面叠加显示。
QT——QCharts实现动态数据可视化曲线
本文详细介绍了如何使用QT的QCharts模块实现动态数据可视化曲线,特别适用于实时曲线监控场景。从环境配置、界面搭建到数据动态更新,提供了完整的实现步骤和性能优化技巧,帮助开发者快速掌握QCharts在实时数据可视化中的应用。
Kali Linux实战:用SET工具包5分钟克隆一个钓鱼网站(附谷歌浏览器登录凭证捕获演示)
本文详细介绍了如何使用Kali Linux中的SET工具包快速克隆钓鱼网站,并演示了如何捕获谷歌浏览器登录凭证。通过实战演练,读者可以了解社会工程学攻击的基本原理及防御措施,强调这些技术仅适用于合法授权的安全测试场景。
Tahoe-100M:解锁单细胞扰动图谱的AI建模新纪元
Tahoe-100M作为单细胞研究的'百科全书',通过包含1亿个细胞、1100种药物扰动和50种癌细胞系的超级数据库,重新定义了生命基本单元的研究方式。其标准化的Mosaic平台显著降低了批次效应,为AI模型提供了高质量的'终极训练场',助力背景敏感的预测模型、药物重定位和虚拟细胞构建等突破性应用。
Qt应用打包实战:从windeployqt到Enigma Virtual Box的完整指南
本文详细介绍了Qt应用程序打包的完整流程,从使用windeployqt收集依赖到使用Enigma Virtual Box封装成单文件。通过实战经验和常见问题解决方案,帮助开发者高效完成Qt应用打包,确保程序在不同环境中稳定运行。
(十一)LVGL定时器:从基础应用到高级调度策略
本文深入探讨LVGL定时器在嵌入式GUI开发中的应用,从基础概念到高级调度策略。通过智能仪表盘实战案例,详细解析定时器的四种经典应用模式,包括动态图表刷新、多数据源轮询等,并分享性能优化与调试技巧,帮助开发者高效利用LVGL定时器提升界面流畅度。
从Counts到FPKM:利用biomaRt实现基因表达量计算与ID转换实战
本文详细介绍了如何利用biomaRt工具从RNA-seq原始计数(raw counts)转换为FPKM标准化基因表达量,并实现基因ID到gene symbol的转换。通过R语言实战演示,涵盖数据准备、基因长度获取、FPKM计算及ID转换等关键步骤,帮助研究人员准确分析基因表达数据。
别再傻傻用现金红包了!微信支付「商家转账到零钱」实战踩坑与场景选择指南
本文深入解析微信支付「商家转账到零钱」与现金红包的核心差异,帮助企业在商业场景中做出最优选择。通过真实案例揭示费率成本、风控规则等关键因素,提供五步决策框架和实战避坑指南,确保资金发放高效安全。