我的低成本3D视觉入门：用Python和OpenCV把普通双目摄像头变成‘立体眼’

吴佳晗

从零打造你的3D视觉实验室：Python+OpenCV双目摄像头实战指南

1. 为什么你需要尝试双目立体视觉

还记得小时候第一次通过立体书看到跃然纸上的恐龙吗？双目立体视觉技术正是将这种神奇体验数字化的钥匙。与动辄上万元的专业3D摄像头相比，普通USB双目摄像头配合开源工具的组合，让立体视觉技术变得触手可及。

想象一下，你可以：

为自制机器人添加环境感知能力
开发简易的3D扫描应用
构建AR/VR项目的深度感知模块
制作自己的体感交互设备

核心优势在于成本控制——整套方案硬件投入不超过500元，软件工具完全开源。这为创客、教育工作者和硬件爱好者打开了一扇低成本探索3D视觉的大门。

2. 硬件准备与基础配置

2.1 选择合适的双目摄像头

市面上的USB双目摄像头主要分为两种类型：

分体式双摄像头：两个独立摄像头通过支架组合
一体式双目模组：出厂校准好的集成设备

对于初学者，推荐选择一体式模组，它们通常具有：

更稳定的物理结构
出厂基础校准
统一的驱动支持

注意：购买时确认摄像头支持UVC协议，这能确保在Linux和Windows系统下的即插即用。

2.2 环境搭建检查清单

bash复制# 基础Python环境（推荐使用conda）
conda create -n stereo python=3.8
conda activate stereo

# 安装核心依赖
pip install opencv-contrib-python numpy matplotlib

硬件连接验证代码：

python复制import cv2

cap = cv2.VideoCapture(1)  # 通常双目摄像头占用1号设备索引
cap.set(cv2.CAP_PROP_FRAME_WIDTH, 1280)  # 常见双目分辨率
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)

while True:
    ret, frame = cap.read()
    if not ret:
        print("摄像头读取失败，请检查连接")
        break
        
    cv2.imshow('双目光流', frame)
    if cv2.waitKey(1) == 27:
        break

cap.release()
cv2.destroyAllWindows()

常见问题排查表：

现象	可能原因	解决方案
画面卡顿	USB带宽不足	尝试USB3.0接口或降低分辨率
图像错位	分辨率设置错误	确认摄像头实际支持的分辨率
单侧黑屏	摄像头驱动问题	检查设备管理器中的摄像头状态

3. 立体视觉的核心：相机标定实战

3.1 制作标定工具：棋盘格的秘密

标定精度取决于棋盘格的质量，这里有几个实用建议：

使用激光打印机在哑光铜版纸上打印
将棋盘粘贴到平整的硬质底板上
确保每个方格边长误差<0.1mm

OpenCV标准棋盘格参数：

内角点数量：9x6（即10x7个方格）
推荐物理尺寸：24mm方格
最小拍摄数量：12组不同角度

python复制# 生成自定义棋盘格
import cv2
import numpy as np

pattern_size = (9, 6)  # 内角点数量
square_size = 24       # 毫米单位
pattern = np.zeros((pattern_size[1]*100, pattern_size[0]*100), dtype=np.uint8)

# 绘制棋盘格
for i in range(pattern_size[1]):
    for j in range(pattern_size[0]):
        if (i + j) % 2 == 0:
            pattern[i*100:(i+1)*100, j*100:(j+1)*100] = 255

cv2.imwrite('custom_chessboard.png', pattern)

3.2 标定数据采集的艺术

采集优质标定图像的技巧：

覆盖摄像头整个视野范围
包含各种倾斜角度（15°-45°）
确保棋盘格在两侧图像中都完整可见
避免强光反射和阴影干扰

自动化采集脚本：

python复制import os
import cv2

SAVE_DIR = 'calibration_data'
os.makedirs(SAVE_DIR, exist_ok=True)

cap = cv2.VideoCapture(1)
cap.set(cv2.CAP_PROP_FRAME_WIDTH, 1280)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)

count = 0
while count < 20:  # 采集20组数据
    ret, frame = cap.read()
    cv2.imshow('Capture', frame)
    
    key = cv2.waitKey(100)
    if key == 32:  # 空格键触发保存
        left_img = frame[:, :640]
        right_img = frame[:, 640:]
        cv2.imwrite(f'{SAVE_DIR}/left_{count}.jpg', left_img)
        cv2.imwrite(f'{SAVE_DIR}/right_{count}.jpg', right_img)
        print(f'Saved sample {count}')
        count += 1
    elif key == 27:  # ESC退出
        break

cap.release()
cv2.destroyAllWindows()

4. 从理论到实践：立体矫正全解析

4.1 标定参数计算原理

立体标定实际上在求解两组关键参数：

单相机参数（每侧摄像头独立）：
- 内参矩阵（焦距、主点坐标）
- 畸变系数（径向和切向畸变）
立体系统参数（双摄像头关系）：
- 旋转矩阵R
- 平移向量T

python复制def stereo_calibration(left_images, right_images, pattern_size=(9,6), square_size=24.0):
    # 准备物体坐标系中的角点坐标
    objp = np.zeros((pattern_size[0]*pattern_size[1], 3), np.float32)
    objp[:,:2] = np.mgrid[0:pattern_size[0], 0:pattern_size[1]].T.reshape(-1,2) * square_size
    
    # 检测角点
    objpoints = []
    imgpoints_left = []
    imgpoints_right = []
    
    for l_img, r_img in zip(left_images, right_images):
        # 左侧图像处理
        gray_l = cv2.cvtColor(l_img, cv2.COLOR_BGR2GRAY)
        ret_l, corners_l = cv2.findChessboardCorners(gray_l, pattern_size, None)
        if ret_l:
            corners_l = cv2.cornerSubPix(gray_l, corners_l, (11,11), (-1,-1), 
                                       (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001))
        
        # 右侧图像处理
        gray_r = cv2.cvtColor(r_img, cv2.COLOR_BGR2GRAY)
        ret_r, corners_r = cv2.findChessboardCorners(gray_r, pattern_size, None)
        if ret_r:
            corners_r = cv2.cornerSubPix(gray_r, corners_r, (11,11), (-1,-1),
                                       (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001))
        
        if ret_l and ret_r:
            objpoints.append(objp)
            imgpoints_left.append(corners_l)
            imgpoints_right.append(corners_r)
    
    # 单目标定
    ret, mtx_l, dist_l, _, _ = cv2.calibrateCamera(objpoints, imgpoints_left, gray_l.shape[::-1], None, None)
    ret, mtx_r, dist_r, _, _ = cv2.calibrateCamera(objpoints, imgpoints_right, gray_r.shape[::-1], None, None)
    
    # 双目标定
    flags = cv2.CALIB_FIX_INTRINSIC
    criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 100, 1e-5)
    ret, _, _, _, _, R, T, E, F = cv2.stereoCalibrate(
        objpoints, imgpoints_left, imgpoints_right,
        mtx_l, dist_l, mtx_r, dist_r, gray_l.shape[::-1],
        criteria=criteria, flags=flags)
    
    return mtx_l, dist_l, mtx_r, dist_r, R, T

4.2 立体矫正可视化验证

矫正质量检查的实用方法：

水平对齐测试：
- 在矫正后的图像上绘制水平线
- 观察对应特征点是否在同一水平线上
视差图生成：
- 使用SGBM算法生成初步深度图
- 检查深度过渡是否自然

python复制def draw_horizontal_lines(image, num_lines=10):
    h, w = image.shape[:2]
    for y in np.linspace(0, h-1, num_lines).astype(int):
        cv2.line(image, (0, y), (w-1, y), (0, 255, 0), 1)
    return image

# 加载矫正后的图像
left_rect = cv2.imread('rectified_left.jpg', 0)
right_rect = cv2.imread('rectified_right.jpg', 0)

# 创建可视化画布
vis = np.zeros((left_rect.shape[0], left_rect.shape[1]*2), np.uint8)
vis[:, :left_rect.shape[1]] = left_rect
vis[:, left_rect.shape[1]:] = right_rect

# 添加水平参考线
vis = draw_horizontal_lines(vis)

cv2.imshow('Stereo Rectification Check', vis)
cv2.waitKey(0)
cv2.destroyAllWindows()

5. 进阶应用：从矫正到深度感知

5.1 视差图计算实战

OpenCV提供了多种立体匹配算法，这里展示SGBM算法的实现：

python复制def compute_disparity(left_img, right_img):
    # 转换为灰度图
    left_gray = cv2.cvtColor(left_img, cv2.COLOR_BGR2GRAY)
    right_gray = cv2.cvtColor(right_img, cv2.COLOR_BGR2GRAY)
    
    # 设置SGBM参数
    window_size = 3
    min_disp = 0
    num_disp = 16*5
    stereo = cv2.StereoSGBM_create(
        minDisparity=min_disp,
        numDisparities=num_disp,
        blockSize=16,
        P1=8*3*window_size**2,
        P2=32*3*window_size**2,
        disp12MaxDiff=1,
        uniquenessRatio=10,
        speckleWindowSize=100,
        speckleRange=32
    )
    
    # 计算视差
    disp = stereo.compute(left_gray, right_gray).astype(np.float32) / 16.0
    
    # 可视化归一化
    disp_norm = (disp - min_disp) / num_disp
    disp_norm = np.uint8(disp_norm * 255)
    disp_color = cv2.applyColorMap(disp_norm, cv2.COLORMAP_JET)
    
    return disp, disp_color

5.2 3D坐标重建基础

有了视差图后，我们可以将2D像素坐标转换为3D空间坐标：

python复制def disparity_to_3d(disparity_map, Q):
    # Q是从stereoRectify得到的4x4重投影矩阵
    points_3d = cv2.reprojectImageTo3D(disparity_map, Q)
    
    # 过滤无效点（视差为0或负值）
    mask = disparity_map > disparity_map.min()
    points = points_3d[mask]
    
    return points

实际项目中，我发现在1米距离范围内，这种方案能达到约2cm的深度分辨率，完全满足大多数创客项目的需求。一个有趣的实验是测量已知尺寸物体的长宽，验证系统精度——我的测试结果显示误差通常在3%以内。