金融网站SHA256withRSA签名逆向分析与Python实现

莫姐

1. 逆向目标与背景分析

今天要拆解的是一个理财网站的数据请求加密机制，核心在于破解其采用的SHA256withRSA签名算法。这类金融类网站通常会对敏感接口进行严格加密，而本次遇到的正是典型的非对称加密应用场景。

通过初步抓包发现，该网站的查询接口（/queryMenu/disclosureSubject）在请求时携带了三个关键参数：

i：原始参数字符串（明文）
r：加密后的签名值（密文）
n：用于签名的私钥内容

这种组合方式在金融行业非常普遍，主要目的是实现"防篡改+身份认证"双重保障。服务器持有公钥可验证签名真实性，而客户端用私钥签名确保请求来源可信。

2. 逆向工程全流程解析

2.1 抓包与参数定位

使用Chrome开发者工具捕获到的请求示例如下：

http复制POST https://xinxipilu.chinawealth.com.cn/queryMenu/disclosureSubject HTTP/1.1
Content-Type: application/json

{
    "i": "pageNum=1&pageSize=10",
    "r": "aBcDeF...==",
    "n": "MIIEvg..."
}

关键发现：

请求体为JSON格式，非传统表单提交
加密参数集中在r字段，与i字段存在明显对应关系
私钥n以PEM格式直接传输（风险点：实际业务中应避免）

2.2 加密函数定位技巧

在JS逆向中，签名函数的定位往往是最关键的突破口。本次实践中尝试了三种搜索策略：

直接搜索signature：结果过多（200+），难以定位
搜索signature:：无结果（冒号限定失败）
搜索signature=：精准命中目标函数Me()

经验：加密参数名搜索建议优先尝试等号(=)作为后缀，比冒号(:)命中率更高

2.3 核心加密函数分析

定位到的Me函数实现如下：

javascript复制function Me(e, t) {
    const o = x.KEYUTIL.getKey(t)
      , n = new x.KJUR.crypto.Signature({
        alg: "SHA256withRSA"
    });
    return n.init(o),
    n.updateString(e),
    x.hextob64(n.sign())
}

代码解析：

使用KEYUTIL.getKey()加载PEM格式私钥
创建Signature实例并指定算法为SHA256withRSA
初始化签名器后传入明文数据
最终输出Base64编码的签名结果

关键库依赖：

jsrsasign（通过全局变量x暴露）
算法标识符SHA256withRSA是Java风格的命名约定

3. 加密算法深度剖析

3.1 SHA256withRSA技术原理

这种签名方案实际上是两种算法的组合：

SHA256：对原始数据计算哈希值（固定输出256位）
RSA：用私钥对哈希值进行加密

具体流程：

code复制原始数据 → SHA256哈希 → RSA私钥加密 → Base64编码 → 最终签名

3.2 与其他签名算法的对比

算法类型	哈希强度	密钥长度	典型应用场景
MD5withRSA	128位	2048位	历史遗留系统
SHA1withRSA	160位	2048位	传统数字证书
SHA256withRSA	256位	2048位	现代金融系统（本例）
SHA384withRSA	384位	3072位	高安全需求场景

选择SHA256withRSA的三大优势：

抗碰撞性优于SHA1（已不推荐）
计算效率比SHA384更高
兼容性广泛，主流语言/平台均支持

4. Python实现方案

4.1 密码学库选型

推荐使用cryptography库（比PyCrypto更活跃维护），安装：

bash复制pip install cryptography

4.2 完整实现代码

python复制import base64
from cryptography.hazmat.primitives import serialization, hashes
from cryptography.hazmat.primitives.asymmetric import padding

def rsa_sign(data_str: str, private_key_pem: str) -> str:
    """
    SHA256withRSA签名实现
    
    :param data_str: 待签名字符串
    :param private_key_pem: PEM格式私钥
    :return: Base64编码的签名
    """
    # 1. 加载私钥
    private_key = serialization.load_pem_private_key(
        private_key_pem.encode('utf-8'),
        password=None,
    )
    
    # 2. 执行签名
    signature = private_key.sign(
        data_str.encode('utf-8'),
        padding.PKCS1v15(),
        hashes.SHA256()
    )
    
    # 3. Base64编码
    return base64.b64encode(signature).decode('utf-8')

4.3 关键参数说明

填充方案：必须使用PKCS1v15（与JS端保持一致）
哈希算法：SHA256()指定哈希方式
密钥加载：支持PKCS8和传统PEM格式

注意：如果私钥有密码保护，需要在load_pem_private_key中传入password参数

5. 爬虫集成实践

5.1 请求构造示例

python复制import requests

def make_request(url: str, params: dict, private_key: str):
    # 1. 构造查询字符串
    query_str = '&'.join(f'{k}={v}' for k,v in params.items())
    
    # 2. 生成签名
    signature = rsa_sign(query_str, private_key)
    
    # 3. 发送请求
    payload = {
        "i": query_str,
        "r": signature,
        "n": private_key  # 实际业务中应预置密钥
    }
    return requests.post(url, json=payload).json()

5.2 分页处理技巧

当需要爬取多页数据时，需注意：

保持相同的密钥实例（避免重复加载）
页码参数(pageNum)必须包含在签名内容中
建议添加随机延迟（金融类网站反爬严格）

python复制for page in range(1, 6):  # 爬取前5页
    data = make_request(
        "https://xinxipilu.chinawealth.com.cn/queryMenu/disclosureSubject",
        {"pageNum": page, "pageSize": 20},
        private_key
    )
    process_data(data)
    time.sleep(random.uniform(1, 3))

6. 常见问题排查

6.1 签名验证失败的可能原因

现象	排查方向	解决方案
服务器返回签名无效	1. 公私钥不匹配	检查密钥对是否对应
	2. 数据包含不可见字符	统一使用UTF-8编码
报错"Invalid padding"	填充方案不一致	确保两端都使用PKCS1v15
中文参数签名失败	URL编码问题	对参数值单独编码后再拼接

6.2 JavaScript与Python差异点

密钥格式：
- JS的jsrsasign支持多种格式
- Python需标准PEM格式（BEGIN PRIVATE KEY）
哈希计算：
- JS自动处理字符串编码
- Python需显式调用encode()
Base64输出：
- JS的hextob64包含换行符
- Python的b64encode需手动decode()

7. 安全增强建议

在实际爬虫开发中，建议采取以下安全措施：

密钥管理：
- 不要硬编码在代码中
- 使用环境变量或密钥管理服务
请求防护：
- 添加User-Agent轮换
- 重要操作添加时间戳防重放

错误处理：

python复制try:
    resp = make_request(...)
    if resp.get('code') != 200:
        raise Exception(f"API error: {resp.get('msg')}")
except requests.exceptions.SSLError:
    # 处理证书错误
except ValueError:
    # 处理密钥解析错误