微信小程序视频下载保姆级教程：用Fiddler抓包+Python合并TS片段（附完整代码）

仿佛轻云兮如敝月

微信小程序视频高效下载与处理实战指南

从零开始掌握视频流捕获与处理技术

你是否遇到过这样的情况：在微信小程序中发现了一个非常有价值的教学视频或精彩的娱乐内容，想要保存下来反复观看或离线使用，却发现小程序没有提供下载按钮？这种情况对于学生、自媒体从业者或需要收集素材的用户来说尤为常见。本文将带你一步步解决这个痛点，无需深厚的编程基础，只需按照我们的详细指导操作，就能轻松实现微信小程序视频的下载与合并。

与常见的录屏方式相比，直接获取视频源文件有着明显的优势：画质无损、文件体积更小、不受屏幕分辨率限制。更重要的是，一旦掌握了这项技能，你可以批量处理多个视频，大幅提升工作效率。我们将使用Fiddler这一专业网络调试工具捕获视频流，然后通过Python脚本自动化下载和合并过程。

1. 环境准备与Fiddler配置

1.1 Fiddler的安装与基本设置

Fiddler是一款免费的Web调试代理工具，能够记录计算机和互联网之间的所有HTTP/HTTPS通信。首先，我们需要从官方网站下载并安装最新版本的Fiddler Classic。安装过程与常规软件无异，只需一路点击"下一步"即可完成。

安装完成后，打开Fiddler进行初始配置：

启用HTTPS解密：这是关键步骤，因为微信小程序的通信基本都是加密的
- 进入菜单栏：Tools > Options > HTTPS
- 勾选"Decrypt HTTPS traffic"
- 在弹出的证书安装提示中点击"Yes"
配置连接设置：
- 在Connections选项卡中，确保监听端口为8888（默认值）
- 勾选"Allow remote computers to connect"（如果需要在其他设备上使用）
过滤微信流量：
- 在右侧Filters选项卡中，勾选"Use Filters"
- 在"Processes"下拉菜单中选择"Show only the following"
- 输入"WeChat"（微信进程名）

注意：首次安装证书后，建议重启Fiddler和微信客户端以确保所有设置生效。如果在后续步骤中遇到证书警告，可能需要手动将Fiddler根证书添加到受信任的根证书颁发机构。

1.2 微信客户端的代理配置

为了让微信小程序的流量经过Fiddler，我们需要配置系统代理：

打开Windows设置 > 网络和Internet > 代理
开启"手动设置代理"开关
输入地址为127.0.0.1，端口为8888（与Fiddler监听端口一致）
保存设置

验证配置是否成功：

bash复制curl -v http://www.example.com --proxy http://127.0.0.1:8888

如果看到Fiddler捕获到了这次请求，说明代理设置正确。现在可以打开微信PC版，准备捕获小程序视频流量了。

2. 捕获小程序视频流量

2.1 定位目标视频请求

在微信中打开包含目标视频的小程序，开始播放视频。此时Fiddler会捕获到大量请求，我们需要从中筛选出视频流：

在Fiddler的会话列表中，关注Process列显示为"WeChat"的请求
查找URL中包含".m3u8"或".ts"的请求，这些通常是视频流
注意观察响应状态码为200的请求，这表示成功响应

典型的视频流请求特征：

特征项	说明	示例
URL结构	包含m3u8或ts扩展名	`.../playlist.m3u8`
响应类型	通常是video/MP2T	Content-Type: video/MP2T
请求方法	通常是GET	GET /video/segment1.ts

2.2 理解M3U8与TS流

M3U8是一种基于文本的播放列表格式，用于指定媒体片段的位置。它实际上是M3U播放列表格式的UTF-8编码版本。当你在小程序中播放视频时，播放器首先获取M3U8文件，然后根据其中的索引下载各个TS片段进行播放。

一个典型的M3U8文件内容如下：

code复制#EXTM3U
#EXT-X-VERSION:3
#EXT-X-TARGETDURATION:10
#EXT-X-MEDIA-SEQUENCE:0
#EXTINF:10.000000,
segment00001.ts
#EXTINF:10.000000,
segment00002.ts
#EXTINF:10.000000,
segment00003.ts
#EXT-X-ENDLIST

这段文本表示视频被分割为3个10秒长的TS片段。我们的目标就是获取所有这些TS片段的URL，然后批量下载。

2.3 提取视频请求头信息

在Fiddler中，找到视频请求后，我们需要记录以下关键信息用于后续Python脚本：

请求头(Headers)：特别是User-Agent和Host
URL模式：观察TS片段的URL规律，通常是基础URL+序号+.ts
Cookie信息：某些小程序可能需要认证信息

将这些信息整理为Python脚本可用的格式：

python复制headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36...',
    'Host': 'video.example.com',
    'Referer': 'https://servicewechat.com/...'
}
base_url = 'https://video.example.com/path/segment{}.ts'

3. Python自动化下载实现

3.1 设计稳健的下载逻辑

考虑到网络波动和服务器限制，我们的下载脚本需要具备以下功能：

自动探测片段数量：无需手动输入总片段数
断点续传能力：中途失败可以从最后一个成功片段继续
错误重试机制：对失败的请求自动重试多次
进度显示：实时显示下载进度和速度

以下是实现这些功能的Python代码框架：

python复制import requests
import os
from tqdm import tqdm  # 进度条库

def download_ts_segments(base_url, headers, save_dir, max_retry=3):
    if not os.path.exists(save_dir):
        os.makedirs(save_dir)
    
    segment_num = 1
    retry_count = 0
    max_segments = 1000  # 安全限制，防止无限循环
    
    with tqdm(desc="下载进度") as pbar:
        while segment_num <= max_segments and retry_count < max_retry:
            # 格式化序号为5位数，如00001
            seq = f"{segment_num:05d}"
            url = base_url.format(seq)
            save_path = os.path.join(save_dir, f"{seq}.ts")
            
            try:
                response = requests.get(url, headers=headers, stream=True, timeout=10)
                if response.status_code == 200:
                    with open(save_path, 'wb') as f:
                        for chunk in response.iter_content(chunk_size=1024):
                            if chunk:
                                f.write(chunk)
                    pbar.update(1)
                    segment_num += 1
                    retry_count = 0  # 重置重试计数器
                else:
                    retry_count += 1
                    if retry_count >= max_retry:
                        break
            except Exception as e:
                print(f"下载片段{seq}时出错: {str(e)}")
                retry_count += 1
    
    print(f"下载完成，共下载{segment_num-1}个片段")

3.2 处理常见的下载问题

在实际操作中，你可能会遇到以下问题及解决方案：

403 Forbidden错误：
- 检查headers是否完整，特别是User-Agent和Referer
- 尝试添加Cookie信息
下载速度慢：
- 使用多线程下载（注意不要过度并发）
- 调整超时时间为更合理的值
TS片段顺序错乱：
- 确保保存时使用固定位数的序号（如00001.ts）
- 下载完成后按文件名排序

多线程下载的改进版本：

python复制from concurrent.futures import ThreadPoolExecutor

def download_single_ts(args):
    seq, base_url, headers, save_dir = args
    url = base_url.format(f"{seq:05d}")
    save_path = os.path.join(save_dir, f"{seq:05d}.ts")
    
    for _ in range(3):  # 重试3次
        try:
            response = requests.get(url, headers=headers, timeout=10)
            if response.status_code == 200:
                with open(save_path, 'wb') as f:
                    f.write(response.content)
                return True
        except:
            continue
    return False

def download_concurrently(base_url, headers, save_dir, max_workers=5):
    with ThreadPoolExecutor(max_workers=max_workers) as executor:
        results = list(tqdm(
            executor.map(download_single_ts, 
                        [(i, base_url, headers, save_dir) for i in range(1, 1000)]),
            total=1000
        ))
    return sum(results)  # 返回成功下载的数量

4. TS片段合并与格式转换

4.1 高效合并TS文件

下载完成后，我们需要将所有TS片段合并为一个完整的视频文件。最简单的方法是使用二进制合并：

python复制def merge_ts_files(ts_dir, output_file):
    ts_files = sorted([f for f in os.listdir(ts_dir) if f.endswith('.ts')])
    
    with open(output_file, 'wb') as merged:
        for ts_file in tqdm(ts_files, desc="合并进度"):
            with open(os.path.join(ts_dir, ts_file), 'rb') as f:
                merged.write(f.read())
    
    print(f"合并完成，输出文件: {output_file}")

这种方法简单快速，但有时可能会遇到音视频不同步的问题。更可靠的方法是使用FFmpeg工具：

python复制import subprocess

def merge_with_ffmpeg(ts_dir, output_file):
    # 生成文件列表
    with open("file_list.txt", 'w') as f:
        for ts in sorted(os.listdir(ts_dir)):
            if ts.endswith('.ts'):
                f.write(f"file '{os.path.join(ts_dir, ts)}'\n")
    
    # 调用FFmpeg合并
    cmd = [
        'ffmpeg',
        '-f', 'concat',
        '-safe', '0',
        '-i', 'file_list.txt',
        '-c', 'copy',
        output_file
    ]
    subprocess.run(cmd, check=True)

4.2 格式转换与优化

合并后的视频可能需要进一步处理：

转换为MP4格式：

python复制def convert_to_mp4(input_file, output_file):
    cmd = [
        'ffmpeg',
        '-i', input_file,
        '-c:v', 'libx264',
        '-preset', 'fast',
        '-crf', '22',
        '-c:a', 'aac',
        '-b:a', '128k',
        output_file
    ]
    subprocess.run(cmd, check=True)

压缩视频体积：
- 调整CRF值（18-28，数值越大压缩率越高）
- 降低分辨率和帧率

提取音频：

python复制def extract_audio(input_file, output_audio):
    cmd = [
        'ffmpeg',
        '-i', input_file,
        '-vn',
        '-acodec', 'copy',
        output_audio
    ]
    subprocess.run(cmd, check=True)

4.3 完整流程封装

将上述所有步骤整合为一个完整的解决方案：

python复制class VideoDownloader:
    def __init__(self, base_url, headers):
        self.base_url = base_url
        self.headers = headers
    
    def download(self, save_dir='ts_files', max_segments=1000):
        # 实现下载逻辑
        pass
    
    def merge(self, output_file='output.mp4', cleanup=True):
        # 实现合并逻辑
        pass
    
    def process(self, output_file='final.mp4'):
        self.download()
        self.merge(output_file)
        if cleanup:
            import shutil
            shutil.rmtree('ts_files')

5. 高级技巧与异常处理

5.1 动态M3U8处理

有些小程序的M3U8文件是动态生成的，每次请求的TS片段URL都不同。针对这种情况：

实时解析M3U8内容：

python复制def parse_m3u8(m3u8_url, headers):
    response = requests.get(m3u8_url, headers=headers)
    if response.status_code == 200:
        lines = response.text.split('\n')
        ts_urls = [line.strip() for line in lines if line.endswith('.ts')]
        return ts_urls
    return []

处理加密的TS流：
- 解析M3U8中的#EXT-X-KEY标签获取密钥信息
- 使用AES解密TS片段

5.2 自动化监控与下载

对于定期更新的小程序视频，可以设置自动化监控：

python复制import time
from watchdog.observers import Observer
from watchdog.events import FileSystemEventHandler

class M3U8Watcher(FileSystemEventHandler):
    def on_modified(self, event):
        if event.src_path.endswith('.m3u8'):
            # 触发下载流程
            pass

def start_monitoring(path='.'):
    event_handler = M3U8Watcher()
    observer = Observer()
    observer.schedule(event_handler, path, recursive=True)
    observer.start()
    try:
        while True:
            time.sleep(1)
    except KeyboardInterrupt:
        observer.stop()
    observer.join()

5.3 性能优化建议

缓存管理：
- 实现已下载片段的校验和缓存
- 避免重复下载相同内容
网络优化：
- 使用会话保持(Session)
- 启用HTTP持久连接
资源清理：
- 下载完成后自动删除临时文件
- 定期清理过期缓存

python复制def optimize_download():
    session = requests.Session()
    adapter = requests.adapters.HTTPAdapter(
        pool_connections=10,
        pool_maxsize=10,
        max_retries=3
    )
    session.mount('http://', adapter)
    session.mount('https://', adapter)
    return session

6. 图形界面封装

为了让非技术用户也能方便使用，我们可以用PySimpleGUI创建一个简单的图形界面：

python复制import PySimpleGUI as sg

def create_gui():
    layout = [
        [sg.Text("M3U8 URL或基础URL模式:"), sg.Input(key='-URL-')],
        [sg.Text("保存路径:"), sg.Input(key='-PATH-'), sg.FolderBrowse()],
        [sg.Button("开始下载"), sg.Button("退出")],
        [sg.Output(size=(80, 20))]
    ]
    
    window = sg.Window("微信小程序视频下载器", layout)
    
    while True:
        event, values = window.read()
        if event in (None, '退出'):
            break
        if event == '开始下载':
            base_url = values['-URL-']
            save_dir = values['-PATH-'] or 'ts_files'
            downloader = VideoDownloader(base_url, headers)
            downloader.process()
    
    window.close()

这个GUI可以进一步扩展，添加进度显示、历史记录等功能，让整个工具更加用户友好。

7. 移动端视频获取方案

虽然本文主要介绍PC端的解决方案，但有时我们也需要从移动端获取视频。这里简要介绍两种方法：

通过电脑共享网络捕获：
- 设置电脑为热点或共享WiFi
- 配置移动设备使用电脑代理
- 在Fiddler中捕获移动设备流量
Android设备本地捕获：
- 使用Packet Capture等APP
- 无需root即可捕获设备流量
- 导出捕获的HAR文件分析

python复制def analyze_har(file_path):
    import json
    with open(file_path, 'r', encoding='utf-8') as f:
        har_data = json.load(f)
    
    video_entries = []
    for entry in har_data['log']['entries']:
        if entry['request']['url'].endswith(('.m3u8', '.ts')):
            video_entries.append(entry)
    
    return video_entries

8. 实际案例分析

让我们通过一个真实案例来演示整个流程。假设我们要下载一个微信小程序中的烹饪教学视频：

准备工作：
- 确保Fiddler和微信PC版已安装并配置好代理
- 清空Fiddler的会话列表以便于查找
捕获过程：
- 打开目标小程序，找到要下载的视频
- 开始播放视频，观察Fiddler中的请求
- 找到类似.../playlist.m3u8的请求
分析请求：
- 右键点击该请求，选择"Copy > Headers Only"
- 分析Headers中的关键信息，特别是User-Agent
- 查看Response内容，确认TS片段URL模式
Python脚本调整：
- 根据实际URL模式修改base_url
- 设置正确的headers
- 开始下载
合并与验证：
- 下载完成后运行合并脚本
- 使用播放器验证合并后的视频是否完整
- 如有问题，检查TS片段顺序或尝试FFmpeg合并

通过这个案例，我们发现实际URL模式为：
https://video.example.com/path/segment_00001.ts到segment_00120.ts

相应的Python代码调整为：

python复制base_url = 'https://video.example.com/path/segment_{}.ts'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36...',
    'Referer': 'https://servicewechat.com/...'
}

downloader = VideoDownloader(base_url, headers)
downloader.process(output_file='cooking_tutorial.mp4')

9. 常见问题与解决方案

在实际操作中，你可能会遇到以下典型问题：

Fiddler捕获不到小程序流量：
- 确认微信代理设置正确
- 检查Fiddler过滤器是否设置正确
- 尝试关闭防火墙或杀毒软件
TS片段下载不完整：
- 增加超时时间和重试次数
- 检查网络连接稳定性
- 验证headers信息是否正确
合并后的视频无法播放：
- 确保所有TS片段都已正确下载
- 尝试使用FFmpeg重新编码而非简单合并
- 检查视频编码格式是否被播放器支持
遇到403/404错误：
- 确认视频资源未被移除
- 检查请求headers是否完整
- 尝试添加必要的Cookie信息
视频有加密：
- 在M3U8文件中查找#EXT-X-KEY标签
- 获取密钥URI和IV参数
- 使用AES解密TS片段

针对加密视频的解密示例：

python复制from Crypto.Cipher import AES

def decrypt_ts(encrypted_data, key, iv):
    cipher = AES.new(key, AES.MODE_CBC, iv=iv)
    return cipher.decrypt(encrypted_data)

# 使用方式
with open('encrypted.ts', 'rb') as f:
    encrypted = f.read()
decrypted = decrypt_ts(encrypted, key, iv)
with open('decrypted.ts', 'wb') as f:
    f.write(decrypted)

10. 工具优化与扩展思路

为了让这个解决方案更加完善，可以考虑以下优化方向：

浏览器扩展开发：
- 开发Chrome扩展自动识别页面中的视频流
- 一键生成下载脚本
云服务集成：
- 将下载任务部署到云函数
- 自动转存到云存储
智能识别系统：
- 使用机器学习识别视频流模式
- 自动适配不同网站的视频结构
分布式下载：
- 使用多台服务器并行下载
- 大幅提升大视频的下载速度
跨平台支持：
- 开发macOS和Linux版本
- 支持移动端APP

一个简单的云函数部署示例（以AWS Lambda为例）：

python复制import boto3
from tempfile import mkdtemp
import shutil

def lambda_handler(event, context):
    base_url = event['base_url']
    headers = event.get('headers', {})
    bucket = event['bucket']
    output_key = event.get('output_key', 'output.mp4')
    
    temp_dir = mkdtemp()
    try:
        downloader = VideoDownloader(base_url, headers)
        downloader.download(save_dir=temp_dir)
        output_path = os.path.join(temp_dir, output_key)
        downloader.merge(output_file=output_path, cleanup=False)
        
        s3 = boto3.client('s3')
        s3.upload_file(output_path, bucket, output_key)
        return {
            'statusCode': 200,
            'body': f"Video uploaded to s3://{bucket}/{output_key}"
        }
    finally:
        shutil.rmtree(temp_dir)

已经到底了哦

精选内容

1 微信小程序蓝牙通信实战：从设备发现到数据收发全流程解析 2 第二章 Odoo开发之模块构建实战--从零到一打造一个图书管理应用（流程详解）3 UE5蓝图通信别再死记硬背了！用‘开关门’和‘BOSS死亡’两个实战案例，带你彻底搞懂事件分发器和接口 4 Python-pptx进阶指南：从数据可视化到自动化报告生成 5 手把手教你用argparse给Python脚本加个“智能”帮助页（含默认值显示技巧）6 BPI FLASH 操作实战指南（三）——擦除、编程与读取的时序验证与调试 7 Linux 存储探秘（一）`flash_erase`：精准掌控Flash的“格式化”艺术 8 从LeNet到ResNeXt：用Python和PyTorch复现10个经典CNN模型（附完整代码）9 别再只懂MaxPool了！用PyTorch的AvgPool2d为你的CNN模型注入‘平滑’力量 10 龙芯教育派到手第一步：保姆级系统重装与WIFI/SSH配置避坑指南（附Loongpio库安装）