CTF新手必看:手把手教你用Python脚本修复PNG图片宽高(以BUUCTF Findme为例)

southbread

CTF新手实战:用Python脚本修复PNG图片宽高的完整指南

在CTF竞赛中,PNG图片隐写术是常见的考察点。许多新手第一次遇到被修改了宽高的PNG图片时,往往会感到无从下手。本文将以BUUCTF平台上的"Findme"题目为例,带你从零开始编写Python脚本修复图片宽高,并深入理解背后的技术原理。

1. 理解PNG文件结构与宽高修改原理

PNG文件由多个数据块(chunk)组成,其中最关键的是IHDR块。这个块包含了图片的基本信息,包括宽度、高度、位深度等。当我们用十六进制编辑器查看PNG文件时,IHDR块总是位于文件开头附近。

IHDR块的结构如下:

字段 长度(字节) 说明
Length 4 IHDR数据块的长度,固定为13
Chunk Type 4 固定为"IHDR"(0x49 0x48 0x44 0x52)
Width 4 图片宽度(大端序)
Height 4 图片高度(大端序)
Bit depth 1 位深度
Color type 1 颜色类型
Compression 1 压缩方法
Filter 1 过滤方法
Interlace 1 隔行扫描方法
CRC 4 IHDR块的CRC校验值

当CTF题目修改了PNG的宽高但忘记更新CRC校验值时,就会出现图片无法正常显示的情况。我们可以利用CRC校验的这一特性,通过暴力破解找出正确的宽高值。

2. 准备Python开发环境

在开始编写修复脚本前,我们需要确保Python环境已准备好必要的库:

bash复制pip install pillow  # 用于验证修复后的图片

核心工具库Python已内置:

  • zlib:用于计算CRC32校验值
  • struct:用于处理二进制数据

提示:建议使用Python 3.6+版本,本文所有代码均基于Python 3.8测试通过

3. 编写PNG宽高修复脚本

下面我们分步骤构建完整的修复脚本,每个部分都有详细解释:

3.1 读取PNG文件并定位关键数据

python复制import zlib
import struct

def repair_png_width_height(filename):
    # 以二进制模式读取文件
    with open(filename, 'rb') as f:
        png_data = bytearray(f.read())
    
    # IHDR块从第12字节开始(跳过8字节签名和4字节长度)
    ihdr_start = 12
    ihdr_data = png_data[ihdr_start:ihdr_start+17]  # 13字节数据+4字节CRC
    
    # 提取原始CRC值(最后4字节)
    original_crc = ihdr_data[-4:]
    crc32key = int.from_bytes(original_crc, byteorder='big', signed=False)
    
    print(f"原始CRC值: 0x{crc32key:08X}")

这段代码完成了:

  1. 读取PNG文件的二进制数据
  2. 定位IHDR块的位置
  3. 提取原始的CRC校验值

3.2 暴力破解正确的宽高值

python复制    # 准备IHDR数据部分(不包含长度和块类型)
    ihdr_content = png_data[ihdr_start+4:ihdr_start+4+13]
    
    # 设置合理的宽高搜索范围
    max_dimension = 4096  # 假设图片宽高不会超过4096像素
    
    for width in range(max_dimension):
        # 将宽度转换为4字节大端序格式
        width_bytes = struct.pack('>i', width)
        
        for height in range(max_dimension):
            # 将高度转换为4字节大端序格式
            height_bytes = struct.pack('>i', height)
            
            # 替换宽高数据
            new_ihdr = bytearray(ihdr_content)
            new_ihdr[0:4] = width_bytes  # 替换宽度
            new_ihdr[4:8] = height_bytes  # 替换高度
            
            # 计算CRC32校验值
            crc32result = zlib.crc32(new_ihdr)
            
            if crc32result == crc32key:
                print(f"找到匹配的宽高: {width}x{height}")
                print(f"CRC32: 0x{crc32result:08X}")
                
                # 更新原始PNG数据中的宽高值
                png_data[ihdr_start+8:ihdr_start+12] = width_bytes
                png_data[ihdr_start+12:ihdr_start+16] = height_bytes
                
                # 保存修复后的文件
                new_filename = filename.replace('.png', '_fixed.png')
                with open(new_filename, 'wb') as f:
                    f.write(png_data)
                
                return width, height
    
    print("未找到匹配的宽高组合")
    return None, None

这段代码的核心逻辑是:

  1. 遍历所有可能的宽高组合(0-4095)
  2. 对每个组合计算CRC32值
  3. 当找到与原始CRC匹配的组合时,更新PNG文件并保存

3.3 完整脚本与使用方法

将上述代码组合起来,我们得到完整的修复脚本:

python复制import zlib
import struct

def repair_png_width_height(filename):
    with open(filename, 'rb') as f:
        png_data = bytearray(f.read())
    
    ihdr_start = 12
    ihdr_data = png_data[ihdr_start:ihdr_start+17]
    original_crc = ihdr_data[-4:]
    crc32key = int.from_bytes(original_crc, byteorder='big', signed=False)
    
    ihdr_content = png_data[ihdr_start+4:ihdr_start+4+13]
    max_dimension = 4096
    
    for width in range(max_dimension):
        width_bytes = struct.pack('>i', width)
        
        for height in range(max_dimension):
            height_bytes = struct.pack('>i', height)
            
            new_ihdr = bytearray(ihdr_content)
            new_ihdr[0:4] = width_bytes
            new_ihdr[4:8] = height_bytes
            
            crc32result = zlib.crc32(new_ihdr)
            
            if crc32result == crc32key:
                print(f"找到匹配的宽高: {width}x{height}")
                
                png_data[ihdr_start+8:ihdr_start+12] = width_bytes
                png_data[ihdr_start+12:ihdr_start+16] = height_bytes
                
                new_filename = filename.replace('.png', '_fixed.png')
                with open(new_filename, 'wb') as f:
                    f.write(png_data)
                
                return width, height
    
    print("未找到匹配的宽高组合")
    return None, None

if __name__ == '__main__':
    import sys
    if len(sys.argv) != 2:
        print("使用方法: python repair_png.py <filename.png>")
        sys.exit(1)
    
    width, height = repair_png_width_height(sys.argv[1])
    if width is not None:
        print(f"修复成功! 保存为 {sys.argv[1].replace('.png', '_fixed.png')}")

使用方法:

bash复制python repair_png.py corrupted.png

4. 优化脚本性能

上面的基础脚本虽然能用,但在处理大尺寸图片时效率较低。我们可以进行以下优化:

4.1 多进程加速

python复制import multiprocessing

def check_dimensions(args):
    width, ihdr_content, crc32key = args
    width_bytes = struct.pack('>i', width)
    
    for height in range(4096):
        height_bytes = struct.pack('>i', height)
        new_ihdr = bytearray(ihdr_content)
        new_ihdr[0:4] = width_bytes
        new_ihdr[4:8] = height_bytes
        if zlib.crc32(new_ihdr) == crc32key:
            return width, height
    return None

def repair_png_fast(filename):
    # ... (前面的读取代码相同)
    
    with multiprocessing.Pool() as pool:
        args = [(w, ihdr_content, crc32key) for w in range(4096)]
        results = pool.imap_unordered(check_dimensions, args)
        
        for result in results:
            if result is not None:
                width, height = result
                # ... (后面的修复代码相同)
                break

4.2 CRC逆向计算优化

对于更高级的优化,我们可以利用CRC的数学性质,通过已知的CRC值和部分数据,直接计算出宽度或高度,而不需要暴力破解。这种方法需要更深入的数学知识,但可以将破解时间从几分钟缩短到几秒钟。

5. 实际CTF题目中的应用技巧

在BUUCTF的"Findme"题目中,修复图片宽高只是第一步。根据原始题目描述,后续还需要:

  1. 检查IDAT块标识是否正确
  2. 使用Stegsolve分析颜色通道
  3. 寻找隐藏的二维码和Base64编码

这类题目通常考察的是综合的隐写分析能力。修复宽高后,建议使用以下工具进行进一步分析:

  • 010 Editor:专业的二进制编辑器,带有PNG模板
  • Stegsolve:分析图片隐写的利器
  • binwalk:检测文件中隐藏的其他文件

注意:在CTF比赛中,时间就是分数。建议先快速尝试常见的隐写方法,如宽高修复、LSB隐写、文件尾附加数据等,再逐步深入分析。

6. 常见问题与调试技巧

在编写和运行修复脚本时,可能会遇到以下问题:

问题1:脚本运行很久都没结果

  • 检查CRC值是否正确提取
  • 尝试缩小宽高搜索范围
  • 使用print输出当前尝试的宽高,确认脚本在运行

问题2:修复后的图片仍然无法显示

  • 确认IHDR块的其他参数(如位深度、颜色类型)是否正确
  • 检查文件签名(PNG文件头应为89 50 4E 47 0D 0A 1A 0A)
  • 使用pngcheck工具验证文件完整性

问题3:找到多个匹配的宽高组合

  • 理论上CRC32碰撞概率很低,如果出现多个匹配,可能是:
    • 搜索范围过大
    • CRC值提取错误
    • 文件本身损坏

调试时可以添加以下代码检查数据:

python复制print(f"IHDR内容: {ihdr_content.hex(' ')}")
print(f"CRC32键: {crc32key:08X}")

7. 扩展学习与资源推荐

掌握了PNG宽高修复后,可以进一步学习以下内容:

  • PNG文件格式详解

    • 官方规范:https://www.w3.org/TR/PNG/
    • PNG块类型大全(IDAT, IEND, tEXt等)
  • CTF隐写术进阶

    • LSB隐写与提取
    • 文件格式混淆技巧
    • 基于FFT的频率域隐写分析
  • 推荐工具

    • exiftool:查看和修改图片元数据
    • stegoveritas:自动化隐写分析工具
    • zsteg:专门检测PNG和BMP中的隐写

在BUUCTF平台上,类似的题目还有:

  • [简单二维码]
  • [LSB隐写入门]
  • [文件中的秘密]

修复图片宽高只是CTF隐写术的入门技能,但理解了这个过程,你就掌握了分析文件格式和二进制数据的基本方法。

内容推荐

Three.js 实战:用 CatmullRomCurve3 和贴图动画,5分钟搞定智慧城市道路流光效果
本文详细介绍了如何使用Three.js的CatmullRomCurve3和贴图动画技术,在5分钟内实现智慧城市道路流光特效。通过构建平滑路径、创建管道几何体、配置动态贴图材质以及优化动画性能,开发者可以快速为3D城市模型添加科技感十足的动态效果。
【游戏开发进阶】在Unity中打造角色受击后能量逸散与重构的特效(ShaderGraph | 溶解 | 顶点动画 | 视觉反馈)
本文详细讲解了在Unity中使用ShaderGraph和粒子系统实现角色受击后能量逸散与重构特效的技术方案。通过溶解效果、顶点动画与粒子系统的深度集成,打造出具有能量流动感的视觉反馈,提升游戏战斗体验的沉浸感。重点介绍了ShaderGraph参数配置、粒子运动轨迹控制以及性能优化技巧。
Fast R-CNN:从共享卷积到多任务损失,剖析目标检测的加速与优化之道
本文深入解析Fast R-CNN在目标检测领域的核心创新与优化策略,重点探讨了ROI池化层和多任务损失函数的设计原理。通过共享卷积特征和统一训练流程,Fast R-CNN显著提升了检测速度与精度,为现代计算机视觉应用提供了高效解决方案。文章还分享了工程实现中的关键技巧与实战经验。
Transformer在医学影像中的逆袭:LN-DETR如何用PC-EMA模块打败传统CNN?
本文深入探讨了LN-DETR模型在医学影像分析中的革命性应用,特别是其创新的PC-EMA模块如何通过多尺度特征融合技术显著提升肺结节检测的准确性和效率。实验数据显示,LN-DETR在LUNA16数据集上达到91.5%的F1分数,较传统CNN方法提升显著,为肺癌早期筛查提供了更可靠的解决方案。
从新手到精通:极光尔沃A3s切片软件JGcreater核心参数实战解析
本文深入解析极光尔沃A3s切片软件JGcreater的核心参数设置,从层高、外壳厚度到填充密度和支撑结构,提供实战技巧与优化建议。通过详细对比和实测数据,帮助用户从新手快速进阶,掌握3D打印的精细化控制,提升打印效率与模型质量。
JMeter插件管理神器Plugins Manager保姆级教程(附常用插件推荐)
本文详细介绍了JMeter插件管理神器Plugins Manager的安装与使用教程,帮助用户高效管理插件并避免常见问题。文章还推荐了PerfMon、Response Times Over Time等必装插件,提升测试报告的专业性。通过本教程,测试工程师可以轻松掌握插件管理技巧,优化性能测试流程。
华为2288H V5服务器硬盘黄灯常亮?别急着换盘,BIOS里这个‘Make Unconfigured Good’操作能救活
本文详细解析了华为2288H V5服务器硬盘黄灯常亮的常见原因及高效处理方法。通过BIOS中的'Make Unconfigured Good'操作,大多数被误判为故障的硬盘可以恢复使用,避免不必要的更换成本。文章还提供了标准化处理流程和预防措施,帮助运维团队快速解决问题并减少误报。
全向高增益天线:从基础理论到现代组阵技术演进
本文深入探讨了全向高增益天线的基础理论及现代组阵技术演进。从N元等幅线阵到共线折合振子阵、富兰克林天线阵,再到现代缝隙耦合串馈技术和印刷共线天线阵,详细解析了关键技术突破与性能优化方法,并提供了典型应用场景的选型建议,为通信系统设计提供实用参考。
从配置到应用:深入解析NR SRS的时频资源映射与跳频机制
本文深入解析NR SRS(上行参考信号)的时频资源映射与跳频机制,详细介绍了其在5G网络中的核心作用及R16版本的增强特性。通过实际案例和优化建议,展示了如何灵活配置SRS参数以提升上行信道估计精度、MIMO性能和调度效率,适用于密集城区、高速移动及节能场景。
告别命令行恐惧!用VSCode+Darknet在Windows10上可视化调试YOLOv4训练全过程
本文详细介绍了如何在Windows10系统上使用VSCode和Darknet可视化调试YOLOv4训练全过程,帮助开发者摆脱命令行恐惧。通过图形化界面配置环境、编译项目、准备数据集、训练模型及可视化调试,大幅提升目标检测模型开发效率。特别适合深度学习初学者在Windows平台上快速上手YOLOv4训练。
MATLAB新手也能懂:用Jakes模型仿真120km/h车速下的无线信道衰落(附完整代码)
本文详细介绍了如何使用MATLAB中的Jakes模型仿真120km/h车速下的无线信道衰落,特别适合MATLAB新手学习。文章从理论到实践,提供了完整的代码实现和可视化分析,帮助读者理解瑞利信道和多普勒谱的特性,并附有调试技巧和进阶应用示例。
【MODIS数据处理实战】基于MOD09Q1高时序数据构建NDVI合成流程
本文详细介绍了基于MOD09Q1高时序数据构建NDVI合成流程的实战方法。通过对比MOD13Q1现成产品,MOD09Q1每8天提供的地表反射率数据在作物监测、气候事件响应等方面具有更高时间分辨率优势。文章涵盖数据获取、MRT工具预处理、NDVI计算及后处理技巧,帮助用户掌握从反射率到高质量NDVI产品的完整链条,提升植被监测精度。
AutoCAD C# 多段线自相交检测:从IntersectWith到精准过滤
本文详细介绍了在AutoCAD中使用C#进行多段线自相交检测的方法,重点解析了IntersectWith方法的原理及顶点过滤的精准检测方案。通过实际案例和代码示例,展示了如何优化性能并解决常见问题,为AutoCAD二次开发提供了实用的技术指导。
Windows物理机+VMware跑OpenWrt软路由?VLAN数据丢失的坑我帮你填了
本文详细解析了在Windows物理机+VMware环境下运行OpenWrt软路由时遇到的VLAN数据丢失问题,提供了修改网卡高级属性和注册表两种解决方案,并附上完整的OpenWrt配置参考和性能优化建议,帮助用户彻底解决VLAN Tag被剥离导致的拨号上网失败问题。
MM配置实战:深度解析业务伙伴角色定义与视图分配(SPRO路径:FLVN00/FLCU00等关键事务码详解)
本文深入解析SAP MM模块中业务伙伴(BP)角色配置的核心逻辑与实战技巧,重点介绍FLVN00/FLCU00等关键事务码的视图分配方法。通过供应商与客户标准角色配置对比、自定义角色创建案例,以及多组织架构下的最佳实践,帮助用户高效管理业务伙伴数据,避免常见配置错误。
Vue项目里语音播报没声音?别慌,搞定Chrome 89+的localService和cancel()就稳了
本文深入解析Vue项目中语音播报无声问题,特别是在Chrome 89+版本中的解决方案。通过强制使用localService本地语音合成服务和正确调用cancel()方法管理语音队列,确保语音播报功能稳定运行。文章提供了完整的Vue实现方案和进阶技巧,帮助开发者快速解决类似问题。
FPGA DDR3设计实战:OCT与RZQ电阻的选型与校准全解析
本文深入解析FPGA DDR3设计中OCT(On-Chip Termination)与RZQ电阻的选型与校准关键要点。通过实战案例和实测数据,揭示RZQ电阻精度、布局规则对信号完整性的影响,并提供Xilinx和Intel平台的OCT校准流程与故障排查技巧,帮助工程师解决高速DDR3设计中的阻抗匹配难题。
吃灰小熊派复活记:用STM32CubeMX+SPI点亮LCD,附赠圆形绘制与多字体显示代码
本文详细介绍了如何使用STM32CubeMX和SPI接口驱动小熊派开发板的LCD屏幕,包括硬件准备、CubeMX工程创建、LCD驱动移植、图形显示进阶技巧及性能优化。通过实战案例和代码示例,帮助开发者快速掌握STM32的SPI通信和LCD显示技术,实现圆形绘制与多字体显示功能。
电子工程师必备:用Bode图设计RC低通滤波器的3个实战技巧(含计算器链接)
本文为电子工程师提供了使用Bode图设计RC低通滤波器的3个实战技巧,包括从衰减斜率反推RC参数的黄金法则、示波器实测与理论曲线的对比诊断法以及多级滤波器的相位累积补偿技巧。文章还包含实用的计算器链接和工具推荐,帮助工程师快速实现高性能滤波器设计。
Vue 项目构建之 sass-loader 版本兼容性深度解析与实战
本文深入解析Vue项目中sass-loader版本兼容性问题,特别是常见的`TypeError: this.getOptions is not a function`报错。通过分析sass-loader与Webpack的版本对应关系,提供降级、升级工具链等实战解决方案,帮助开发者有效解决构建问题并优化项目维护策略。
已经到底了哦
精选内容
热门内容
最新内容
保姆级教程:用C语言clock()函数实测算法时间复杂度(附PTA数据结构题解)
本文提供了一份详细的C语言教程,教你如何使用clock()函数实测算法时间复杂度,并通过PTA数据结构题解进行实战验证。文章涵盖了从理论到实践的完整流程,包括线性时间和平方时间算法的验证,以及如何避免常见测量误差,帮助读者深入理解算法效率分析。
别再只盯着PeMS了!手把手教你用Python实战滴滴盖亚数据集做交通需求预测
本文详细介绍了如何使用Python和滴滴盖亚数据集构建高精度交通需求预测模型。通过对比PeMS数据集,滴滴盖亚在数据维度、时间精度和空间覆盖上具有显著优势。文章从数据预处理、时空特征工程到模型构建(XGBoost和ST-GNN)提供了完整实战指南,并分享了部署优化技巧,帮助开发者提升预测准确率。
别再只看行覆盖率了!用Jacoco报告揪出那些被忽略的‘幽灵分支’和‘僵尸代码’
本文深入探讨了Jacoco报告在代码覆盖率分析中的多维应用,揭示了仅依赖行覆盖率的局限性,并指导如何通过分支覆盖和指令覆盖发现‘幽灵分支’和‘僵尸代码’。文章提供了实战案例和高级技巧,帮助开发者提升测试质量,确保代码逻辑完整性。
自然码双拼:从入门到精通的效率革命
本文深入解析自然码双拼输入法的高效实践,从击键次数减半的核心优势到声韵对应的设计哲学,详细介绍了三周训练计划和辅助码系统等进阶技巧。通过全平台配置方案和实战案例,帮助用户实现从入门到精通的效率革命,显著提升输入速度和思维连贯性。
别再死记硬背了!用Python+Logisim仿真,5分钟搞懂RS/JK/D/T触发器工作原理
本文通过Python+Logisim仿真实验,直观演示RS/JK/D/T触发器的工作原理,帮助读者快速理解数字电路中的核心概念。无需死记硬背真值表,通过动态观察波形图和动手搭建电路,自然掌握各种触发器的特性和应用场景。
Nlog实战:从基础配置到企业级日志架构设计
本文详细介绍了Nlog从基础配置到企业级日志架构设计的全流程。通过Nlog的简洁配置、结构化日志记录、多目标输出及与监控系统集成等实战技巧,帮助.NET开发者构建高效、可扩展的日志管理系统,显著提升系统可观测性和问题排查效率。
ESP32-S AT固件连接MQTT保姆级教程:从TCP到WSS,三种加密方式实战避坑
本文详细解析了ESP32-S AT固件连接MQTT的三种加密方式(TCP、TLS、WSS),提供从基础配置到高级优化的实战指南。通过真实案例和常见错误分析,帮助开发者规避证书配置陷阱,提升物联网设备连接稳定性和安全性,特别适合安信可模组用户参考。
从Button点击到复杂事件系统:手把手教你用UnityEvent和UnityAction构建可维护的游戏逻辑
本文详细介绍了如何使用UnityEvent和UnityAction构建可维护的游戏事件系统,从基础的Button点击到复杂的多模块交互。通过解耦事件触发与响应,开发者可以创建模块化、易扩展的游戏逻辑,特别适用于成就系统、UI交互等场景。文章包含实战代码示例和性能优化建议,帮助开发者掌握Unity事件驱动架构的核心技术。
XMOS实战解析:从多核架构到实时应用开发
本文深入解析XMOS多核架构及其在实时应用开发中的实战技巧。从硬件事件响应系统到多核任务分配,详细介绍了XMOS在音频处理和工业控制领域的高性能表现。通过具体案例和代码示例,展示如何利用XMOS的时间确定性优势实现微秒级响应,适合开发者学习参考。
告别Remix在线调试:手把手教你用Geth控制台本地调试智能合约函数(读写操作全解析)
本文详细介绍了如何使用Geth控制台在本地私链上调试智能合约,涵盖从环境搭建、合约部署到函数读写操作的全流程。通过实战示例解析call与sendTransaction的区别,并分享高级调试技巧如事件日志分析和交易追踪,帮助开发者提升以太坊智能合约开发效率。