Native逆向实战(一)——BiliBili Sign算法还原与Frida联动分析

JuicyMio

1. 逆向分析前的准备工作

在开始逆向分析B站Sign算法之前,我们需要做好充分的准备工作。首先需要明确的是,逆向分析本质上是一个"黑盒测试"的过程,我们需要通过各种工具和技术手段,逐步揭开目标系统的内部实现逻辑。

1.1 工具准备清单

进行Native层逆向分析需要准备以下工具链:

  • 反编译工具:JADX或JEB用于Java层分析
  • 动态调试工具:Frida框架及其配套工具
  • 静态分析工具:IDA Pro或Ghidra
  • 辅助工具:JNItrace、Objection等
  • 开发环境:Python环境、Android SDK等

我建议初学者可以先从Frida和JADX这两个工具入手,它们的学习曲线相对平缓,而且社区资源丰富。在实际工作中,我经常遇到一些开发者问"为什么我的Frida脚本不生效",90%的情况都是因为环境配置问题,所以一定要确保工具链配置正确。

1.2 目标定位策略

在逆向工程中,定位目标函数是关键的第一步。对于B站的Sign算法,我们可以采用"由外而内"的分析策略:

  1. 首先通过抓包分析确定需要逆向的API接口
  2. 在Java层定位到生成签名的入口方法
  3. 通过调用栈分析找到Native层的实现

在实际操作中,我通常会先用Objection进行快速的函数Hook,这样可以快速缩小分析范围。比如对于B站的案例,我们可以先用以下命令快速定位:

bash复制objection -g tv.danmaku.bili explore
android hooking watch class_method com.bilibili.nativelibrary.LibBili.s --dump-args --dump-backtrace --dump-return

2. Java层分析与定位

2.1 入口方法定位

通过分析网络请求,我们可以发现B站的API请求中都会携带一个sign参数。通过Hook网络请求库,我们可以追溯到签名生成的入口点。在我的分析过程中,发现签名生成最终调用了com.bilibili.nativelibrary.LibBili.s方法。

这个方法的特点是:

  • 接收一个SortedMap对象作为参数
  • 返回一个SignedQuery对象
  • 是一个native方法,实现在so库中

2.2 Frida Hook脚本编写

为了更详细地观察方法的输入输出,我编写了以下Frida Hook脚本:

javascript复制function hookSign() {
    Java.perform(function() {
        var LibBili = Java.use("com.bilibili.nativelibrary.LibBili");
        LibBili.s.implementation = function(map) {
            console.log("\n[+] Input Map Contents:");
            var entries = map.entrySet().toArray();
            for (var i = 0; i < entries.length; i++) {
                var entry = entries[i];
                console.log(entry.getKey() + " => " + entry.getValue());
            }
            
            var result = this.s(map);
            console.log("\n[+] Return Value: " + result);
            return result;
        };
    });
}

这个脚本不仅能打印输入参数,还能输出返回值。在实际调试中,我发现B站的签名算法对参数顺序敏感,这也是为什么参数类型是SortedMap而不是普通的Map。

3. Native层动态分析

3.1 JNI函数定位技巧

定位Native函数有两种主要方式:静态注册和动态注册。通过实践发现B站使用的是动态注册方式,这需要我们使用特殊的技巧来定位。

我推荐使用改进版的RegisterNatives Hook脚本:

javascript复制function hook_RegisterNatives() {
    var symbols = Module.enumerateSymbolsSync("libart.so");
    var addrRegisterNatives = null;
    
    // 查找RegisterNatives函数地址
    symbols.forEach(function(symbol) {
        if (symbol.name.includes("RegisterNatives") && 
            !symbol.name.includes("CheckJNI")) {
            addrRegisterNatives = symbol.address;
            console.log("RegisterNatives found at:", symbol.address);
        }
    });

    if (addrRegisterNatives) {
        Interceptor.attach(addrRegisterNatives, {
            onEnter: function(args) {
                var className = Java.vm.tryGetEnv().getClassName(args[1]);
                if (className === "com.bilibili.nativelibrary.LibBili") {
                    var methodCount = args[3].toInt32();
                    var methodsPtr = args[2];
                    
                    for (var i = 0; i < methodCount; i++) {
                        var namePtr = Memory.readPointer(methodsPtr.add(i * Process.pointerSize * 3));
                        var sigPtr = Memory.readPointer(methodsPtr.add(i * Process.pointerSize * 3 + Process.pointerSize));
                        var fnPtr = Memory.readPointer(methodsPtr.add(i * Process.pointerSize * 3 + Process.pointerSize * 2));
                        
                        var name = Memory.readCString(namePtr);
                        var sig = Memory.readCString(sigPtr);
                        var module = Process.findModuleByAddress(fnPtr);
                        
                        console.log(`[RegisterNatives] ${name} ${sig} at ${fnPtr} in ${module.name}`);
                    }
                }
            }
        });
    }
}

这个脚本可以帮助我们准确找到目标Native函数的地址和所在的so库。

3.2 JNItrace实战技巧

JNItrace是一个强大的工具,但在实际使用中需要注意以下几点:

  1. 使用spawn模式而不是attach模式,后者在某些情况下会出现问题
  2. 配合Frida主动调用可以获得更清晰的调用轨迹
  3. 需要过滤无关的JNI调用,避免信息过载

一个实用的JNItrace命令如下:

bash复制jnitrace -l libbili.so -m spawn tv.danmaku.bili

在实际分析中,我发现JNItrace的输出非常详细,但需要结合上下文理解。比如当看到GetStringUTFChars调用时,需要关注它操作的是哪个Java字符串,这通常可以通过指针地址回溯来确定。

4. 静态分析与算法还原

4.1 IDA静态分析要点

拿到so文件后,我习惯先用IDA进行初步分析。对于B站的libbili.so,分析过程有几个关键点:

  1. 首先定位到目标函数的偏移地址(通过动态分析获得)
  2. 修复JNIEnv参数类型,这有助于IDA生成更准确的伪代码
  3. 识别关键的字符串操作和加密函数

在IDA中,我通常会进行以下操作:

  • 重命名关键函数和变量
  • 添加详细的注释
  • 分析函数的控制流程图
  • 识别加密算法的特征常量

4.2 签名算法解析

通过动态和静态分析的结合,我逐步还原出了B站的签名算法流程:

  1. 将输入参数排序后拼接成字符串
  2. 在字符串末尾追加一个固定密钥
  3. 对拼接后的字符串进行MD5哈希
  4. 将MD5结果转换为16进制字符串作为最终签名

关键代码逻辑如下:

c复制// 伪代码表示签名生成过程
void generate_sign(JNIEnv *env, jobject map) {
    // 1. 从map中获取参数并排序拼接
    string sorted_params = sort_and_concat_params(map);
    
    // 2. 追加固定密钥
    string sign_input = sorted_params + "560c52ccd288fed045859ed18bffd973";
    
    // 3. 计算MD5
    unsigned char md5_result[16];
    MD5((unsigned char*)sign_input.c_str(), sign_input.length(), md5_result);
    
    // 4. 转换为16进制字符串
    char sign[33];
    for(int i = 0; i < 16; i++) {
        sprintf(sign + i*2, "%02x", md5_result[i]);
    }
    
    // 返回结果
    return env->NewStringUTF(sign);
}

在实际验证过程中,我编写了一个Python脚本来模拟这个签名过程,确认能够生成与服务端一致的签名。

5. 逆向技巧与经验分享

5.1 动态分析与静态分析的结合

在逆向工程中,动态分析和静态分析应该交替进行。我的典型工作流程是:

  1. 先用动态分析工具快速定位关键点
  2. 通过静态分析理解整体逻辑
  3. 再回到动态分析验证假设
  4. 不断迭代直到完全理解算法

这种方法可以避免陷入静态分析的细节泥潭,也能防止动态分析的片面性。

5.2 常见问题与解决方案

在实际逆向过程中,我遇到过各种问题,以下是几个典型场景及解决方法:

问题1:Frida脚本无法注入

  • 检查设备是否root
  • 确认frida-server正在运行
  • 尝试更换注入模式(spawn/attach)

问题2:IDA无法识别JNI函数参数

  • 手动修正函数原型
  • 参考JNI文档添加正确的参数类型
  • 通过动态分析确定参数的实际用途

问题3:算法识别困难

  • 查找加密算法的特征常量
  • 对比已知算法实现
  • 使用自动化工具如FindCrypt

5.3 性能优化建议

逆向分析往往需要反复尝试,以下是一些提高效率的建议:

  1. 编写可复用的Frida脚本
  2. 建立自己的代码片段库
  3. 使用Python自动化常见任务
  4. 对关键函数添加书签和注释
  5. 保持有组织的分析记录

我在实际项目中发现,良好的工程实践可以显著提高逆向效率。比如为每个分析项目创建独立的工作目录,使用版本控制管理分析脚本等。

内容推荐

用STM32F407的ADC给智能小车调速:从电位器读数到PWM电机控制的完整流程
本文详细介绍了如何使用STM32F407的ADC模块实现智能小车的精确调速,从电位器读数到PWM电机控制的完整流程。通过硬件设计、软件配置及信号处理,展示了如何构建一个高效的调速闭环系统,适用于各种智能小车项目。
从报错到流畅:Visual Studio Code 搭建 Arduino 环境的避坑实践
本文详细介绍了如何在Visual Studio Code中高效搭建Arduino开发环境,解决常见报错问题。从基础配置到高级优化,涵盖路径设置、头文件缺失、编码问题等解决方案,帮助开发者提升工作效率,实现从Arduino IDE到VSCode的平滑过渡。
PID控制还能这样用?汇川PLC开关量输出调温避坑指南
本文详细介绍了如何利用汇川PLC的开关量输出实现精密温度控制,通过PID算法和梯形图编程技巧,将普通开关量输出转化为高效的调温工具。文章涵盖了底层逻辑、编程实战、继电器寿命优化及现场调试等关键内容,特别适合预算有限的中小型工业项目。
从心跳到接管:深入解析Heartbeat高可用集群的守护机制
本文深入解析Heartbeat高可用集群的守护机制,重点介绍心跳监测、故障检测、裂脑防护和资源接管等核心功能。通过实际案例和配置示例,展示如何构建稳定可靠的Linux-HA集群,确保关键业务持续可用。文章还分享了性能调优和监控集成的实战经验,帮助运维人员有效应对生产环境挑战。
别再只盯着通道注意力了!手把手复现ECCV 2020的HAN超分网络,聊聊层间注意力那些事儿
本文深入解析ECCV 2020提出的HAN超分网络中的层间注意力机制(LAM),突破传统通道注意力的局限。通过PyTorch代码实现和DIV2K数据集实战,展示如何动态调整不同深度特征层的权重关联,提升图像超分辨率性能。文章详细对比了HAN与传统方法在PSNR指标上的优势,并分享注意力模块的部署优化技巧。
用闲置的PS2手柄和Arduino UNO,做个能调速的遥控小车(附完整代码和接线图)
本文详细介绍了如何利用闲置的PS2手柄和Arduino UNO制作一个可调速的智能遥控小车。从硬件准备、PS2手柄的深度开发到电机控制的高级玩法,提供了完整的代码和接线图,帮助读者实现精准的遥控调速功能。特别强调了摇杆灵敏度调节和PWM控制算法,适合DIY爱好者和硬件开发者。
Cadence 17.2 安装保姆级教程:从下载到破解,一次搞定(附阿狸狗大师链接)
本文提供Cadence 17.2的详细安装教程,涵盖从下载、安装到破解的全过程,特别针对硬件工程师常见的安装问题提供解决方案。内容包括版本选择、硬件配置建议、安装目录设置、破解工具使用及授权配置等关键步骤,帮助用户顺利完成软件安装并优化使用体验。
在VSCode中配置STM32标准库开发环境:从零搭建gcc+openOCD工作流
本文详细介绍了在VSCode中配置STM32标准库开发环境的完整流程,包括gcc和openOCD工具链的安装、工程结构设计、Makefile编写以及调试配置。通过开源工具链的组合,开发者可以免费搭建高效的STM32开发环境,适用于跨平台协作和长期项目维护。
别再只写裸机了!用STM32+FreeRTOS管理多外设:以温度报警器项目为例讲透实时系统
本文以STM32+FreeRTOS构建温度报警器项目为例,详细解析了实时操作系统在多外设管理中的优势。通过对比裸机编程的局限性,展示了FreeRTOS在任务划分、优先级设计和任务间通信方面的实践方法,帮助开发者提升嵌入式系统的实时性和可维护性。
Python+Lumerical实战:超表面逆运算优化彩色图像处理(附完整代码)
本文详细介绍了如何利用Python与Lumerical(FDTD)联合实现超表面逆运算优化彩色图像处理。通过Lumerical的Python API(Lumopt),开发者可以高效设计超表面结构,提升光能利用率至90%以上,并突破传统滤光片的性能瓶颈。文章包含完整代码示例和优化策略,助力光学成像系统创新。
告别重复劳动:用STM32CubeIDE创建你的第一个可复用工程模板(含GPIO、RCC完整配置)
本文详细介绍了如何使用STM32CubeIDE创建可复用的工程模板,涵盖GPIO和RCC时钟配置等核心外设初始化。通过标准化配置和代码生成优化,开发者可以大幅提升STM32开发效率,减少重复劳动。文章还提供了高级定制技巧和模板管理最佳实践,帮助团队建立高效的开发流程。
绿联NAS部署OnlyOffice容器与Cloudreve集成实现高效文档协作
本文详细介绍了在绿联NAS上部署OnlyOffice容器并与Cloudreve集成的完整方案,实现高效的文档在线预览与协作。通过Docker容器化部署,结合WOPI协议,用户可在私有环境中获得媲美商业云文档的体验,同时确保数据安全。文章涵盖硬件配置、安装步骤、性能优化及安全加固等实用内容,特别适合中小团队搭建私有化文档协作平台。
告别爆音!手把手教你用C语言实现PCM音频音量调节(附16bit防溢出代码)
本文详细介绍了如何使用C语言实现PCM音频音量调节,重点解决16bit音频处理中的爆音问题。从PCM基础概念到防溢出代码实现,再到符合人耳感知的音量曲线设计,提供了一套完整的音频处理方案,帮助开发者提升音频处理质量。
KT6368A蓝牙模块选型指南:对比ESP32/CC2541,看透传、功耗和成本怎么选
本文深入分析KT6368A蓝牙模块在协议栈、功耗和成本方面的选型策略,对比ESP32和CC2541的优劣。通过实测数据揭示透传模式下的隐藏成本,包括协议栈内存占用、功耗曲线及开发效率差异,为智能穿戴和IoT设备提供精准选型建议。
OpenWrt 双频合一与多路由 Mesh 组网实战:从零搭建家庭无缝网络
本文详细介绍了如何利用OpenWrt实现双频合一与多路由Mesh组网,打造家庭无缝网络。从设备选型、固件准备到基础网络配置和Mesh组网深度优化,提供了一套完整的实战方案,帮助解决WiFi信号差、网速慢等问题,实现全屋覆盖和无感切换。
从拒稿到录用:我的TCSVT论文实战复盘与心得
本文详细分享了作者从TCSVT论文拒稿到最终录用的完整经历与实战心得。通过解析拒稿重投、大修、小修等关键阶段,提供了与审稿人沟通的艺术、时间管理技巧及心态调整策略,为青年研究者提供了宝贵的投稿经验与实用建议。
GD32 Timer+DMA驱动WS2812:从波形调试到稳定显示的实战避坑指南
本文详细介绍了使用GD32的Timer和DMA驱动WS2812灯带的实战经验,从硬件连接、定时器配置到DMA传输优化,提供了波形调试技巧和典型问题排查指南。重点解决了电平匹配、PWM信号生成和DMA稳定性等关键问题,帮助开发者快速实现稳定显示效果。
从‘EPERM’到顺畅安装:新手在Windows/Mac上搭建Node.js项目环境的完整避坑指南
本文为新手提供了在Windows/Mac上搭建Node.js项目环境的完整指南,重点解决常见的'EPERM: operation not permitted'权限错误。通过介绍版本管理工具nvm、配置npm全局路径、优化跨平台工作流等实用技巧,帮助开发者避免安装陷阱,顺利搭建开发环境。
鲁班猫5BTB RK3588平台Ubuntu 22.04下v4l2loopback模块编译与虚拟摄像头实战
本文详细介绍了在鲁班猫5BTB RK3588平台上Ubuntu 22.04系统中编译v4l2loopback模块并配置虚拟摄像头的完整流程。从内核源码获取、环境配置到模块编译与加载,逐步指导开发者解决ARM64架构下的常见问题,并分享实际应用场景如AI视觉测试和直播推流,助力开发者高效实现视频处理功能。
达梦数据库与Sharding-JDBC适配实战:手把手教你扩展ShardingSphere插件
本文详细介绍了达梦数据库与Sharding-JDBC的适配实战,从环境准备到核心适配器实现,再到SPI机制配置与验证,手把手教你扩展ShardingSphere插件。通过具体代码示例和常见问题解决方案,帮助开发者快速构建高性能分库分表方案,适用于国产化替代场景下的海量数据处理需求。
已经到底了哦
精选内容
热门内容
最新内容
Eth-Trunk 实战配置与多VLAN通信优化指南
本文详细介绍了Eth-Trunk技术的企业级应用场景与实战配置方法,特别针对多VLAN通信环境进行优化。通过链路聚合技术实现带宽叠加、动态容灾和智能分流,提升网络可靠性和性能。文章包含硬件准备、分步骤配置详解、负载均衡策略调优及故障排查技巧,助力企业构建高可用网络架构。
别再死记硬背UML了!用PlantUML画一个真实的网上书店对象图(附完整代码)
本文通过PlantUML实战教程,详细讲解如何构建网上书店对象图的5个关键技巧。从基础对象定义到动态关系建立,再到处理集合关系和优化图表,帮助开发者摆脱死记硬背UML的困境,快速掌握类图设计。附完整代码示例,30分钟即可上手。
别再只会用OpenCV的MatchTemplate了!手把手教你实现多角度模板匹配的C#封装库
本文详细介绍了如何突破OpenCV传统模板匹配的局限,实现一个高性能的C#多角度模板匹配库。通过优化图像金字塔、角度搜索和并行计算等策略,解决了目标物体旋转时的匹配难题,适用于工业视觉检测和自动化测试等领域。
别再死记硬背了!用‘敏捷 vs. 瀑布’的真实项目故事理解CPT203软件工程核心
本文通过校园外卖App开发实战,生动解析CPT203软件工程课程中的敏捷与瀑布模型应用。从需求变更处理到架构演进,揭示了Scrum敏捷开发在应对复杂项目时的优势,并分享DevOps实践如何提升交付效率,帮助读者深入理解软件工程核心概念。
ESP-IDF实战:ESP32 SPI驱动片外FLASH从配置到数据读写
本文详细介绍了ESP32 SPI驱动片外FLASH的配置与数据读写实战,涵盖SPI控制器初始化、FLASH设备识别、读写操作及性能优化技巧。通过具体代码示例和常见问题排查方法,帮助开发者高效实现ESP32与SPI FLASH的通信,提升嵌入式存储扩展能力。
告别繁琐配置!用Pybind11在Linux上5分钟搞定C++与Python互调(附完整CMakeLists)
本文详细介绍了如何使用Pybind11在Linux上快速实现C++与Python的互相调用,通过极简的配置和CMake自动化构建,5分钟内完成高性能计算与AI模型推理的双向交互。文章包含完整的环境准备、安装指南、实战Demo及性能优化技巧,帮助开发者告别繁琐配置,提升开发效率。
Amesim中PID控制元件的参数整定与优化实践
本文详细探讨了Amesim中PID控制元件的参数整定与优化实践,涵盖PID控制原理、关键参数详解及工程化整定方法。通过液压缸位置控制和温度控制系统等典型案例,展示了参数优化的具体步骤与技巧,帮助工程师提升系统响应速度和稳定性。文章还提供了高级调参方法和常见故障解决方案,适用于复杂工业控制场景的仿真与优化。
深入解析ArcGIS Pro的Python环境管理:从基础配置到第三方库高效安装
本文深入解析ArcGIS Pro的Python环境管理,从基础配置到第三方库高效安装。详细介绍了conda环境管理、虚拟环境创建与维护,以及使用pip安装第三方库的实战技巧,帮助用户高效管理地理空间分析环境。
从用户请求到硬件响应:深入解析I/O软件的四层架构
本文深入解析I/O软件的四层架构,从用户请求到硬件响应的完整流程。详细介绍了用户层软件、设备独立性软件、设备驱动程序和中断处理程序各层的功能与协作机制,通过实际案例展示如何优化I/O性能,帮助开发者理解并解决跨层问题。
保姆级教程:用Python的Spectral库5分钟搞定高光谱3D立方体可视化(附常见报错解决)
本文提供了一份详细的Python Spectral库教程,帮助用户在5分钟内实现高光谱3D立方体可视化。从环境配置、数据加载到立方体渲染和性能优化,涵盖了常见报错解决方案和进阶技巧,特别适合遥感图像处理和高光谱数据分析的初学者和专业人士。