从针孔模型到像素坐标：相机内参与FOV的工程实践

eagerworks

1. 针孔相机模型：从物理成像到数学表达

想象一下小时候玩过的"小孔成像"实验——在纸箱上戳个小洞，对面墙上就能出现倒立的影像。现代相机的核心原理与此完全相同，只是用镜头替代了针孔，用CMOS传感器替代了墙面。这个看似简单的模型，却是整个计算机视觉的基石。

在实际工程中，我们常用右手坐标系定义相机空间：Z轴指向镜头前方，X轴向右，Y轴向下。假设空间点P坐标为(X,Y,Z)，经过焦距为f的镜头后，在成像平面形成倒立像P'。根据相似三角形原理，可以得到X'=fX/Z和Y'=fY/Z这两个关键公式。不过要注意，原始模型得到的是倒像，而现代相机都会通过软件自动翻转图像，所以我们在推导时可以省略负号，直接把成像平面对称到镜头前方，这样计算更直观。

我第一次做相机标定时，就曾困惑为什么公式里没有负号。后来拆解工业相机才发现，厂商在固件里已经做了图像翻转处理。这个细节提醒我们：理论模型需要根据实际硬件特性进行调整。

2. 像素坐标系：从物理尺寸到数字图像

成像平面上的坐标还是物理尺寸（毫米），而我们需要的是像素坐标。这就引出了两个关键转换：

尺度变换：CMOS传感器每个像素的物理尺寸不同。比如Sony IMX477传感器像素尺寸是1.55μm×1.55μm，意味着每毫米约有645个像素。我们用α和β表示u/v方向的像素密度（pixel/mm）
原点偏移：像素坐标系通常以图像左上角为原点，而成像平面以光轴交点为原点，需要平移(cx,cy)

合并这两个变换，得到：

code复制u = αf(X/Z) + cx = fx(X/Z) + cx
v = βf(Y/Z) + cy = fy(Y/Z) + cy

其中fx=αf，fy=βf。这个转换引出了相机内参矩阵K：

code复制K = [[fx, 0, cx],
     [0, fy, cy],
     [0, 0,  1]]

在无人机视觉项目中，我发现内参的cx/cy并不总是图像中心。某次使用广角镜头时，cx比理论中心偏右15像素，这是因为镜头光学中心与传感器几何中心存在偏差。这个偏差虽然不大，但对立体视觉匹配的精度影响显著。

3. 内参标定实战：从理论到应用

获取准确的内参需要标定过程。推荐使用OpenCV的calibrateCamera函数，配合棋盘格标定板。这里分享几个实用技巧：

标定板选择：棋盘格边长要大于传感器像素尺寸的10倍。比如200万像素相机，建议使用边长30mm以上的棋盘格
拍摄姿势：需要15-20张不同角度照片，覆盖整个视场。特别注意要包含棋盘格的倾斜、旋转状态

参数初始化：可以先用传感器规格估算初始值：

python复制fx_guess = (sensor_width_pixels * focal_length_mm) / sensor_width_mm
cx_guess = sensor_width_pixels / 2

某次给机械臂装双目相机时，我发现标定误差始终在1.2像素以上。后来发现是标定板平整度问题——A4纸打印的棋盘格在湿度变化时会产生形变。改用玻璃基板后，重投影误差直接降到0.3像素以下。

4. FOV计算：从参数到视野评估

视场角(FOV)直接决定相机"看"的范围，计算公式看似简单却容易踩坑：

水平FOV = 2arctan(传感器宽度/(2f))
垂直FOV = 2arctan(传感器高度/(2f))
对角线FOV = 2arctan(传感器对角线长度/(2f))

但实际工程中，我们常用像素坐标计算：

python复制import numpy as np
hfov = 2 * np.arctan2(cx, fx) * 180/np.pi
vfov = 2 * np.arctan2(cy, fy) * 180/np.pi

在VR头盔光学设计时，发现FOV计算值与实测值偏差达5度。排查发现公式默认假设主点(cx,cy)在图像中心，而广角镜头的光学中心偏移会导致实际FOV扩大。修正后的公式需要加入补偿因子：

code复制实际_hfov = 2 * arctan((image_width - cx)/fx)

5. 工程实践中的典型问题

案例1：焦距混淆
有次调试工业相机时，发现35mm镜头计算的FOV比实际小。原因是镜头标注的是35mm等效焦距，而实际焦距需要根据传感器尺寸换算。对于1/2.3英寸传感器，转换系数约5.62，实际焦距=35/5.62≈6.2mm。

案例2：非矩形像素
某些安防相机的像素不是正方形。这时需要区分fx和fy：某型号相机fx=1200，fy=1180，如果错误地认为fx=fy，会导致FOV计算误差约1.5度。

案例3：镜头畸变
广角镜头的桶形畸变会使边缘FOV扩大10%-15%。精确计算需要先去除畸变，或者采用经验公式补偿。一个实用的补偿公式是：

code复制实际_fov = 标称_fov * (1 + 0.12*(distortion_coeff)^2)

6. 参数关联与系统设计

在机器人导航系统中，相机FOV与其他参数存在复杂关联：

分辨率与检测距离：

code复制最小检测像素 = 2  # 目标至少占2×2像素
最远检测距离 = (目标实际宽度 * 焦距) / (最小检测像素 * 像素尺寸)

双目基线计算：

code复制最佳基线距离 = (检测距离 * 像素尺寸) / (2 * tan(FOV/2))

运动模糊控制：

code复制最大允许快门 = (像素尺寸 * 运动容差) / (目标速度 * tan(FOV/2))

在AGV导航项目里，我们通过调整焦距和传感器尺寸的组合，最终在2米检测距离和60cm盲区之间找到了平衡点。这个案例让我深刻理解到，相机选型本质是多参数优化问题。

已经到底了哦

精选内容

1 【电路笔记】- 电位器：从分压到变阻，一文读懂核心原理与选型 2 STM32CubeMx串口通信实战：从阻塞到DMA的进阶配置指南 3 从零到一：深入解析UART/USART的通信协议与核心配置 4 别再让虚拟机卡网了！手把手教你为Hyper-V虚拟交换机开启SR-IOV（附兼容性检查清单）5 Dify实战指南：从零到一，打造可嵌入业务的智能应用门户 6 从零到一：GeoGebra 6 在跨学科教学中的部署与应用指南 7 Altium Designer实战：PCB Layout新手最容易忽略的安规距离，手把手教你查表计算 8 告别HttpClient！用RestSharp在.NET 8中优雅调用Web API（附完整代码示例）9 UDS诊断会话控制（10服务）实战：从权限管理到会话切换的深度解析 10 音频数字化入门指南 | 从模拟到数字的转换艺术