深入Linux内核:图解of_property_read_u32如何从设备树走到内存(4.14内核源码分析)

我会笑你一辈子的

深入Linux内核:图解of_property_read_u32如何从设备树走到内存(4.14内核源码分析)

在嵌入式系统开发中,设备树(Device Tree)作为硬件描述的标准方式,已经成为Linux内核不可或缺的一部分。而of_property_read_u32这个看似简单的API,却是驱动开发者与设备树交互的重要桥梁。本文将带您深入Linux 4.14内核,从内存数据结构到函数调用栈,完整解析一个u32类型属性值是如何从设备树文件一步步传递到驱动程序的。

1. 设备树与内核的桥梁:device_node与property

当Linux内核启动时,设备树编译器(DTC)会将.dts文件编译成.dtb二进制格式。内核在启动过程中解析这个二进制文件,在内存中构建起设备树的完整数据结构。这个过程中,两个关键数据结构起着核心作用:

  • struct device_node:对应设备树中的一个节点,包含以下关键成员:

    c复制struct device_node {
        const char *name;
        const char *type;
        struct property *properties;  // 属性链表头指针
        struct device_node *parent;
        struct device_node *child;
        struct device_node *sibling;
        // ...
    };
    
  • struct property:描述设备树节点的属性,其核心结构为:

    c复制struct property {
        char *name;         // 属性名
        int length;         // 属性值长度
        void *value;        // 属性值指针
        struct property *next;  // 下一个属性
        // ...
    };
    

提示:设备树中的所有属性都以链表形式组织,properties指针就是这个链表的头节点。理解这个链表结构对后续的属性查找过程至关重要。

下图展示了设备树节点在内存中的典型布局:

code复制+-------------------+     +-------------------+
|   device_node     |     |     property      |
|-------------------|     |-------------------|
| *name = "uart1"   |---->| *name = "clock"   |
| *type = "serial"  |     | length = 4        |
| *properties ------|---+ | *value = [0x3d09] |
| *parent           |   | | *next ------------+ 
+-------------------+   | +-------------------+
                        |
                        |  +-------------------+
                        +->|     property      |
                           |-------------------|
                           | *name = "status"  |
                           | length = 5        |
                           | *value = "okay"   |
                           | *next = NULL      |
                           +-------------------+

2. 函数调用栈深度解析

of_property_read_u32的调用过程实际上是一系列函数的精妙协作。让我们从顶层API开始,逐层深入内核:

2.1 调用入口:of_property_read_u32

这是驱动开发者最常接触的接口,其实现极其简洁:

c复制static inline int of_property_read_u32(const struct device_node *np, 
                                      const char *propname,
                                      u32 *out_value)
{
    return of_property_read_u32_array(np, propname, out_value, 1);
}

这个内联函数只是将单值读取转换为数组读取的特例(数组长度为1),体现了Linux内核"组合优于继承"的设计哲学。

2.2 数组读取封装:of_property_read_u32_array

第二层函数处理数组读取的通用情况:

c复制static inline int of_property_read_u32_array(const struct device_node *np,
                                           const char *propname,
                                           u32 *out_values, 
                                           size_t sz)
{
    int ret = of_property_read_variable_u32_array(np, propname, 
                                                out_values, sz, 0);
    if (ret >= 0)
        return 0;
    else
        return ret;
}

这里有两个关键设计点:

  1. 返回值处理:将实际读取的元素数转换为成功/失败的标准返回(0成功,负数错误码)
  2. 参数传递:sz参数指定期望读取的最小元素数

2.3 核心实现:of_property_read_variable_u32_array

这个函数完成了实际工作:

c复制int of_property_read_variable_u32_array(const struct device_node *np,
                                      const char *propname,
                                      u32 *out_values,
                                      size_t sz_min,
                                      size_t sz_max)
{
    size_t sz, count;
    const __be32 *val = of_find_property_value_of_size(np, propname,
                    (sz_min * sizeof(*out_values)),
                    (sz_max * sizeof(*out_values)),
                    &sz);
    
    if (IS_ERR(val))
        return PTR_ERR(val);
    
    if (!sz_max)
        sz = sz_min;
    else
        sz /= sizeof(*out_values);
    
    count = sz;
    while (count--)
        *out_values++ = be32_to_cpup(val++);
    
    return sz;
}

三个关键技术点值得注意:

  1. 字节序转换be32_to_cpup()处理大端(BE)到CPU本地字节序的转换,因为设备树属性值总是以大端格式存储
  2. 大小检查:通过of_find_property_value_of_size确保属性值大小在期望范围内
  3. 内存拷贝:通过循环将属性值逐个拷贝到输出缓冲区

2.4 属性值查找:of_find_property_value_of_size

这个函数验证属性值的大小是否符合预期:

c复制static void *of_find_property_value_of_size(const struct device_node *np,
                                         const char *propname,
                                         u32 min, u32 max,
                                         size_t *len)
{
    struct property *prop = of_find_property(np, propname, NULL);
    
    if (!prop)
        return ERR_PTR(-EINVAL);
    if (!prop->value)
        return ERR_PTR(-ENODATA);
    if (prop->length < min)
        return ERR_PTR(-EOVERFLOW);
    if (max && prop->length > max)
        return ERR_PTR(-EOVERFLOW);
    
    if (len)
        *len = prop->length;
    
    return prop->value;
}

错误处理非常全面,包括:

  • 属性不存在(-EINVAL)
  • 属性无值(-ENODATA)
  • 属性值太小(-EOVERFLOW)
  • 属性值太大(-EOVERFLOW)

3. 关键实现细节剖析

3.1 属性查找与锁保护

真正的属性查找发生在of_find_property中:

c复制struct property *of_find_property(const struct device_node *np,
                                const char *name,
                                int *lenp)
{
    struct property *pp;
    unsigned long flags;
    
    raw_spin_lock_irqsave(&devtree_lock, flags);
    pp = __of_find_property(np, name, lenp);
    raw_spin_unlock_irqrestore(&devtree_lock, flags);
    
    return pp;
}

这里有两个重要设计:

  1. 自旋锁保护devtree_lock保护设备树结构的并发访问,确保在多核环境下安全
  2. 实际查找:委托给__of_find_property完成实际工作

3.2 底层属性查找:__of_find_property

这是属性查找的最底层实现:

c复制static struct property *__of_find_property(const struct device_node *np,
                                         const char *name,
                                         int *lenp)
{
    struct property *pp;
    
    if (!np)
        return NULL;
        
    for (pp = np->properties; pp; pp = pp->next) {
        if (of_prop_cmp(pp->name, name) == 0) {
            if (lenp)
                *lenp = pp->length;
            break;
        }
    }
    
    return pp;
}

查找过程简单直接:线性遍历属性链表,直到找到名称匹配的属性。值得注意的是:

  • 比较效率of_prop_cmp只是strcmp的宏定义,没有特殊优化
  • 线性搜索:属性查找时间复杂度为O(n),这对属性较多的节点可能成为性能瓶颈

3.3 字节序处理机制

设备树属性值总是以大端格式存储,而现代CPU多为小端架构,因此需要转换:

c复制#define be32_to_cpup(ptr) __be32_to_cpu(*(ptr))

static inline u32 __be32_to_cpu(__be32 val)
{
    return (__force u32)swab32((__force u32)val);
}

在ARM等平台上,这个操作会被优化为单条指令(如rev)。

4. 性能优化与实践建议

基于对上述实现的分析,我们可以得出一些重要的实践启示:

4.1 属性访问性能优化

  1. 减少属性查找次数

    c复制// 不佳实践:多次查找同一属性
    of_property_read_u32(np, "clock", &clk);
    of_property_read_string(np, "clock", &clk_name);
    
    // 优化方案:一次性读取所有需要属性
    struct property *pp = of_find_property(np, "clock", NULL);
    if (pp) {
        // 自行解析属性值
    }
    
  2. 属性组织建议

    • 将高频访问的属性放在节点定义的前面
    • 避免单个节点有过多的属性(超过20个应考虑拆分)

4.2 错误处理最佳实践

完整的错误处理应该考虑所有可能的错误情况:

c复制int ret = of_property_read_u32(np, "clock-frequency", &freq);
if (ret) {
    switch (-ret) {
    case EINVAL:
        dev_err(dev, "property does not exist\n");
        break;
    case ENODATA:
        dev_err(dev, "property has no value\n");
        break;
    case EOVERFLOW:
        dev_err(dev, "property size mismatch\n");
        break;
    default:
        dev_err(dev, "unknown error %d\n", ret);
    }
    return ret;
}

4.3 设备树设计建议

  1. 属性命名一致性

    • 保持整个系统中相同功能的属性名称一致
    • 避免使用容易混淆的名称(如clock vs clocks
  2. 值格式规范

    • 对于数值属性,明确说明单位(如clock-frequency单位总是Hz)
    • 对于布尔属性,使用空属性存在表示true,不存在表示false

下表总结了设备树属性访问的常见模式:

访问模式 适用场景 性能 代码复杂度
of_property_read_*系列函数 简单属性读取 中等
直接操作property结构 复杂或批量属性处理
缓存属性指针 高频访问属性 最高

内容推荐

从RK3399到你的笔记本:跨平台CMake版本升级的通用解法与ARM编译提速技巧
本文探讨了从RK3399到笔记本的跨平台CMake版本升级与ARM编译优化策略。针对CMake版本差异带来的构建系统瓶颈,提供了源码编译优化、二进制分发、交叉编译等解决方案,并详细介绍了ARM平台编译加速技巧,帮助开发者高效管理多平台开发环境。
告别KD-Tree:在ROS中实践VoxelMap(LIO)的体素八叉树地图管理
本文探讨了在ROS中实践VoxelMap(LIO)的体素八叉树地图管理,替代传统KD-Tree的方法。通过分析VoxelMap的核心设计理念和八叉树分层策略,展示了其在内存占用、搜索效率和动态更新方面的优势。文章还提供了ROS集成实战、参数调优经验及性能优化技巧,帮助开发者在SLAM系统中实现更高效的地图管理。
告别静默失败:给你的BAPI_PRODORDCONF_CREATE_TT加上配置错误监控(CK466等消息捕获指南)
本文详细解析了SAP生产报工接口BAPI_PRODORDCONF_CREATE_TT在配置错误(如CK466)时的静默失败问题,并提供了实战指南。通过增强实现和防御性编程,帮助开发者实时捕获错误消息,避免成本核算隐患,提升系统集成可靠性。
Vue+Django全栈社区管理系统开发实践
现代Web开发中,前后端分离架构已成为主流技术方案。Vue.js作为渐进式前端框架,通过组件化开发和虚拟DOM技术,能够高效构建交互式用户界面。Django则以"自带电池"著称,其ORM系统和Admin后台为快速开发提供强力支持。在社区管理系统这类需要兼顾用户体验与管理效率的场景中,Vue+Django的组合展现出独特优势:前端可利用Vue Router实现SPA路由跳转,配合Pinia进行状态管理;后端通过Django REST framework构建API,结合Flask处理高性能需求。这种技术栈选择既保证了开发效率,又能满足权限管理、内容审核等业务需求,是构建响应式Web应用的理想方案。
Electron实战之IPC模式全解析:从基础通信到高级场景
本文全面解析Electron中的进程间通信(IPC)模式,从基础概念到高级应用场景。详细介绍了渲染进程与主进程间的多种通信方式,包括ipcRenderer.send、invoke和sendSync,以及主进程主动推送消息的方法。同时探讨了高级场景如渲染进程间通信、大数据传输优化,并提供了安全防护和错误处理的最佳实践,帮助开发者构建高效、安全的Electron应用。
告别书签孤岛:用Floccus与WebDAV云盘构建你的跨浏览器同步网络
本文详细介绍了如何使用Floccus与WebDAV云盘实现跨浏览器书签同步,解决书签孤岛问题。通过Floccus的跨品牌同步、版本控制和自主可控特性,结合坚果云等WebDAV服务,用户可以在不同设备间实时同步书签,提升工作效率并保障数据隐私。
【技术解码】从木星轨迹到虚拟太岁:古代天文算法的演进与实现
本文探讨了古代天文算法从木星轨迹观测到虚拟太岁纪年的演进历程,揭示了古人如何通过抽象模型和算法优化解决天文误差问题。文章分析了木星纪年法的误差累积、太岁纪年法的数学抽象、天球模型的空间坐标系设计以及二十八星宿的模块化结构,展现了古代科技思维与现代算法开发的惊人相似性。
GAMES101作业实战解析:从理论到代码的图形学之旅
本文深入解析GAMES101作业中的图形学实践,从理论到代码实现全面拆解。通过作业0到作业2的实战案例,详细讲解齐次坐标、MVP变换、光栅化等核心概念,并分享深度测试、MSAA反走样等高级技巧的优化经验,帮助读者高效完成图形学编程挑战。
BLHeli电调固件进阶调校:从参数解析到飞行性能优化
本文深入解析BLHeli电调固件的进阶调校方法,从参数物理意义到实际飞行性能优化。详细介绍了启动功率、消磁补偿、电机进角等关键参数的设置技巧,以及竞速飞行、花式飞行和长航时等不同场景的调校方案。通过系统化的调参流程和实战案例,帮助飞手充分发挥电调性能,提升飞行体验。
Ubuntu 22.04上避开Docker 23的坑:保姆级Kolla-Ansible部署OpenStack Yoga指南
本文提供了在Ubuntu 22.04上使用Kolla-Ansible部署OpenStack Yoga的详细指南,重点解决了Docker 23版本与Kolla-Ansible的兼容性问题。通过强制使用Docker 20.10.*版本,避免部署过程中的`KeyError: 'KernelMemory'`错误,确保顺利完成OpenStack Yoga的安装和配置。
给嵌入式工程师的Solidworks 2021 SP5极简安装法:只装3个核心模块,省下10G硬盘空间
本文为嵌入式工程师提供SolidWorks 2021 SP5极简安装指南,仅需安装3个核心模块(SolidWorks Core、Drawing、Toolbox),即可满足90%硬件开发需求,节省64%硬盘空间(约10GB)。文章详细解析模块选择策略、分步安装流程及硬件开发专用配置,帮助提升ECAD-MCAD协同效率,特别适合同时运行Altium和Keil的开发环境。
AI工具如何优化学术开题报告PPT设计与制作
在学术研究领域,开题报告是研究生阶段的重要里程碑,其PPT设计质量直接影响评审效果。随着人工智能技术的发展,AI辅助工具正逐步改变传统的学术PPT制作方式。通过自然语言处理和机器学习算法,这些工具能自动完成文献整理、框架搭建等耗时工作,显著提升研究效率。以AIbiye、AICheck等为代表的专业工具,不仅能生成符合学术规范的流程图和理论框架,还能智能识别研究空白点。在实际应用中,AI工具特别适合处理实验方案设计、参考文献格式化等技术性工作,但核心研究思路仍需研究者把控。合理运用AI辅助,可使开题报告制作时间从20小时缩短至5小时,同时保证学术严谨性。
从网关到源头:深入剖析与实战解决502 Bad Gateway
本文深入剖析了502 Bad Gateway错误的成因与解决方案,从网关到源头系统化地讲解了排查流程。通过实际案例和配置示例,详细介绍了网络连通性检查、代理服务器配置、负载均衡策略调优以及上游服务器健康检查等关键步骤,帮助运维工程师快速定位并解决502错误问题。
ForkJoinPool实战:从并行数组求和到大数据处理的性能跃迁
本文深入探讨了Java中ForkJoinPool的实战应用,从并行数组求和到大数据处理的性能优化。通过分而治之策略和工作窃取算法,ForkJoinPool显著提升了计算密集型任务的效率。文章结合日志分析、批量数据处理等实际案例,详细解析了参数调优、性能陷阱及高级应用场景,帮助开发者掌握这一强大的并发编程工具。
深入解析Xilinx 7系列FPGA配置:从模式选择到时序实战
本文深入解析Xilinx 7系列FPGA配置模式,从SPI、BPI到SelectMAP和JTAG,详细探讨了各种模式的适用场景与实战技巧。结合ug470文档,提供了硬件设计、时序控制及高级配置功能的实用指南,帮助工程师解决常见配置问题,优化FPGA系统性能。
从16KB到64KB:间接寻址单元IU的尺寸博弈如何重塑SSD寿命曲线?
本文探讨了间接寻址单元(IU)尺寸从16KB到64KB的变化如何显著影响SSD的寿命曲线。通过分析DRAM成本、垃圾回收效率和负载特征的三重矛盾,揭示了不同IU尺寸在QLC NAND中的优劣。文章还介绍了现代主控的动态IU调整算法和混合IU分区策略,为SSD寿命优化提供了实用建议。
从理论到实践:剖析ORB-SLAM系统的核心模块与工程实现
本文深入剖析ORB-SLAM系统的核心模块与工程实现,详细解析其精巧的三线程架构(跟踪、建图、回环检测)及数据库设计。通过实战案例分享ORB特征提取优化、地图初始化策略、局部BA优化等关键技术,并探讨工业级应用中遇到的挑战与解决方案,为三维重建和SLAM系统设计提供实用指导。
【QGC实战指南】从零到精通的无人机地面站配置与飞行规划
本文详细介绍了QGroundControl(QGC)地面站的配置与飞行规划实战指南,涵盖从基础连接到高级航迹规划的全面内容。针对PX4飞控用户,提供了传感器校准、航点设置、应急处理等实用技巧,帮助无人机爱好者从入门到精通。
告别VScode默认丑样式!手把手教你用Markdown-preview-enhanced插件打造专属写作环境
本文详细介绍了如何使用Markdown-preview-enhanced插件在VSCode中自定义Markdown预览样式,告别默认的单调界面。通过CSS定制字体、代码高亮和排版等元素,打造既美观又高效的专属写作环境,提升技术写作和笔记记录的视觉体验与工作效率。
麒麟系统部署GreatSQL数据库全流程指南
数据库部署是系统架构中的关键环节,特别是在国产化环境中。以麒麟操作系统为例,部署GreatSQL需要特别注意系统权限、依赖管理和性能调优。Linux系统的umask设置直接影响文件访问权限,合理的0022配置可避免数据库服务启动失败。通过yum安装jemalloc等性能组件能显著提升内存管理效率,而调整vm.swappiness等内核参数则优化了系统资源分配。在国产CPU架构下,GreatSQL展现了优异的兼容性,配合XtraBackup实现物理备份,结合Prometheus监控方案,构建高可用的数据库服务。本文详细解析从环境准备到安全加固的全流程实践。
已经到底了哦
精选内容
热门内容
最新内容
Cadence Virtuoso IC617实战:三步搞定晶体管跨导gm的非线性仿真与曲线绘制
本文详细介绍了在Cadence Virtuoso IC617中进行晶体管跨导gm非线性仿真与曲线绘制的三步实战方法。通过原理图设计、ADE仿真环境配置和结果分析,帮助工程师快速掌握gm非线性特性分析技巧,特别适合模拟集成电路设计中的高精度应用场景。
RK3588 DDR频率调优实战:手把手教你用ddrbin_tool解决板子不稳定问题
本文详细介绍了如何通过ddrbin_tool工具链对RK3588开发板的DDR频率进行调优,解决高负载下的不稳定问题。从诊断工具使用、参数修改到硬件协同优化,提供了一套完整的工程化解决方案,帮助开发者实现从2112MHz降至1560MHz的稳定运行。
60、Flink CDC 实战:构建实时数据管道,实现MySQL到Elasticsearch的流式同步与监控
本文详细介绍了如何使用Flink CDC构建实时数据管道,实现MySQL到Elasticsearch的流式同步与监控。通过实战案例和优化技巧,帮助开发者掌握毫秒级延迟的Streaming ELT技术,解决生产环境中的常见问题,提升数据处理效率。
蓝桥杯嵌入式实战:基于定时器从模式复位机制的高精度PWM频率捕获
本文详细介绍了在蓝桥杯嵌入式竞赛中,如何利用STM32定时器的从模式复位机制实现高精度PWM频率捕获。通过硬件配置、CubeMX设置和代码实现的逐步讲解,帮助开发者解决传统方法中的溢出问题,实现0.1%以内的测量误差,适用于电机转速检测等应用场景。
从知网到Word:用Zotero Connector一键抓取文献,并自动生成GB/T 7714参考文献
本文详细介绍了如何利用Zotero Connector与Word协同工作,实现从知网等平台一键抓取文献并自动生成符合GB/T 7714标准的参考文献。通过Zotero的自动化功能,研究者可以大幅提升文献管理效率,避免手动输入的格式错误,节省大量时间。文章涵盖插件配置、文献抓取技巧、样式适配及Word集成等关键步骤,为学术写作提供全自动化解决方案。
Java反序列化空对象处理方案与最佳实践
在Java开发中,对象反序列化是常见的数据处理操作,但空对象(null)反序列化容易引发NullPointerException等运行时异常。通过空对象模式(Null Object Pattern)和自定义ObjectInputStream等技术方案,可以有效防御NPE风险。这些方法在电商订单系统、风控系统等高频调用场景中尤为重要,能保持业务语义完整性同时提升系统稳定性。结合Spring框架集成和MyBatis类型处理器等工程实践,开发者可以构建健壮的反序列化处理机制。本文重点讨论的集合类特殊处理和性能优化技巧,对处理Redis缓存、分布式系统通信等场景具有普适参考价值。
立创商城旧版TM1650按键失灵?手把手教你用新版手册搞定扫描模式与中断
本文针对立创商城旧版TM1650按键失灵问题,详细解析新旧版数据手册的关键差异,并提供完整的解决方案。重点介绍了扫描模式切换和中断处理的正确配置方法,帮助开发者快速解决按键扫描功能失效问题,提升系统稳定性和响应速度。
Dijkstra算法详解:原理、实现与优化技巧
最短路径算法是图论中的核心问题,用于在加权图中寻找两点间的最优路径。Dijkstra算法采用贪心策略,通过逐步确定最近节点来保证全局最优,特别适合处理边权非负的图结构。其堆优化版本利用优先队列将时间复杂度降至O(mlogn),在工程实践中广泛应用于路由协议、导航系统等场景。本文深入解析算法原理,提供C++实现模板,并分享竞赛中的性能优化技巧,包括防溢出处理、邻接表存储等实用方法,帮助开发者高效解决各类最短路径问题。
移动最小二乘法:从局部拟合到全局逼近的工程实践
本文深入探讨移动最小二乘法(MLS)在工程实践中的应用,从局部拟合到全局逼近的技术细节。通过权函数设计、基函数选择及实际案例分享,揭示MLS在工业检测、曲面重建等场景中的高效性与灵活性,帮助工程师优化计算效率并提升拟合精度。
从振荡波形到平滑曲线:手把手教你用PID Tuner优化Simulink电机速度控制模型
本文详细介绍了如何使用Simulink的PID Tuner工具优化电机速度控制模型,从诊断振荡波形到实现平滑曲线。通过PID参数调试的实战演示,帮助工程师快速掌握自动调参技巧,提升控制系统的响应速度与稳定性,适用于工业自动化和机器人控制等领域。