原地哈希法寻找缺失最小正整数的O(n)算法

长沮

1. 问题分析与算法思路

这道题目要求我们在未排序的整数数组中找到缺失的最小正整数，并且需要在O(n)时间复杂度和常数空间复杂度下完成。乍一看似乎很简单，但实际解决起来需要一些巧妙的思路。

1.1 问题核心理解

首先我们需要明确几个关键点：

我们要找的是"最小的正整数"，所以从1开始检查
数组是未排序的，且可能包含负数、零和大于数组长度的数
时间复杂度要求O(n)意味着不能使用排序（排序通常O(nlogn)）
空间复杂度要求常数意味着不能使用哈希表等额外数据结构

1.2 解题思路分析

最直观的解法可能是：

先排序再遍历查找 - 但排序会破坏O(n)时间复杂度要求
使用哈希表记录出现过的数 - 但会使用O(n)额外空间

我们需要一种原地(in-place)的解决方案。这里可以采用"原地哈希"的思路：

利用数组本身作为哈希表
通过交换元素将每个正整数放到它应该在的位置（即数字x应该放在索引x-1处）

2. 算法实现详解

让我们仔细分析给出的解法代码：

cpp复制class Solution {
public:
    int firstMissingPositive(vector<int>& nums) {
        int n = nums.size();
        // 第一次遍历：将每个数字放到正确的位置
        for (int i = 0; i < n; ++i) {
            while (nums[i] > 0 && nums[i] <= n && nums[nums[i] - 1] != nums[i]) {
                swap(nums[nums[i] - 1], nums[i]);
            }
        }
        // 第二次遍历：检查第一个位置不正确的数字
        for (int i = 0; i < n; ++i) {
            if (nums[i] != i + 1) {
                return i + 1;
            }
        }
        return n + 1;
    }
};

2.1 第一次遍历解析

这个while循环做了以下几件事：

nums[i] > 0：只处理正整数
nums[i] <= n：只处理可能在1-n范围内的数（因为数组长度n，最多需要n个正整数）
nums[nums[i] - 1] != nums[i]：如果当前数字不在它应该在的位置

当满足这三个条件时，我们把当前数字交换到它应该在的位置（即数字x应该放在索引x-1处）

注意：这里使用while而不是if是因为交换后，新的nums[i]可能也需要被处理

2.2 第二次遍历解析

经过第一次遍历后，所有在1-n范围内的正整数都应该被放在正确的位置。因此：

我们遍历数组，检查每个位置i的数字是否是i+1
如果不是，说明i+1就是缺失的最小正整数
如果全部正确，说明1-n都在数组中，缺失的是n+1

3. 算法复杂度分析

3.1 时间复杂度

虽然代码中有嵌套循环，但每个数字最多被交换一次到正确位置，所以总操作次数是O(n)：

每个数字最多被交换一次到正确位置
即使有while循环，整体时间复杂度仍然是O(n)

3.2 空间复杂度

只使用了常数个额外变量（n, i等），满足O(1)空间复杂度要求。

4. 实例演示

让我们用示例2 nums = [3,4,-1,1] 来逐步演示：

初始状态：[3,4,-1,1]

第一次遍历：

i=0: nums[0]=3应该在位置2，交换nums[0]和nums[2]
-> [-1,4,3,1]
i=1: nums[1]=4应该在位置3，交换nums[1]和nums[3]
-> [-1,1,3,4]
- 现在nums[1]=1应该在位置0，交换nums[1]和nums[0]
  -> [1,-1,3,4]
i=2: nums[2]=3已经在正确位置
i=3: nums[3]=4已经在正确位置

最终数组：[1,-1,3,4]

第二次遍历：

nums[0]=1 ✓
nums[1]=-1 ≠ 2 → 返回2

5. 边界情况与注意事项

5.1 特殊输入处理

空数组：应返回1
所有数都小于1：应返回1
数组包含重复数字：算法仍然有效
数组包含大于n的数字：这些数字会被忽略

5.2 实现注意事项

交换时要小心索引越界
while循环条件要写全，避免无限循环
第二次遍历时要注意检查所有位置

6. 算法优化与变种

6.1 替代实现方法

另一种思路是将不符合条件的数字标记为特定值（如n+1），然后使用符号位作为标记：

cpp复制int firstMissingPositive(vector<int>& nums) {
    int n = nums.size();
    
    // 将非正数标记为n+1
    for (int i = 0; i < n; ++i) {
        if (nums[i] <= 0) nums[i] = n + 1;
    }
    
    // 使用符号位标记出现过的数字
    for (int i = 0; i < n; ++i) {
        int num = abs(nums[i]);
        if (num <= n) {
            nums[num - 1] = -abs(nums[num - 1]);
        }
    }
    
    // 找到第一个正数位置
    for (int i = 0; i < n; ++i) {
        if (nums[i] > 0) return i + 1;
    }
    
    return n + 1;
}