二分查找变种：查找目标值边界位置的算法实现-代码聚汇网

二分查找变种：查找目标值边界位置的算法实现

老李校长

1. 题目解析与核心思路

这道力扣经典题目要求我们在一个非递减顺序排列的整数数组中，找到给定目标值的开始和结束位置。如果目标值不存在于数组中，需要返回[-1, -1]。题目要求算法时间复杂度必须是O(log n)级别，这意味着我们需要使用二分查找的变种来实现。

1.1 问题本质分析

这道题看似简单，实则考察了几个关键点：

对二分查找算法的深入理解
处理重复元素的边界条件
在O(log n)时间复杂度内完成查找

在实际工程中，这种查找场景非常常见。比如在日志系统中查找特定时间范围的数据，或者在用户行为记录中查找某个操作的起止位置。

1.2 二分查找的变种应用

常规二分查找在找到目标值后就返回，但本题需要找到目标值的边界。我们需要实现两种变种：

查找左边界：即使找到目标值，仍然继续向左搜索
查找右边界：即使找到目标值，仍然继续向右搜索

这种变种算法在工程实践中被称为"二分查找的边界版本"，是每个合格开发者都应该掌握的技能。

2. 算法实现详解

2.1 查找左边界的实现

查找左边界的核心在于，当nums[mid] == target时，我们不立即返回，而是继续向左搜索：

python复制def find_left_bound(nums, target):
    left, right = 0, len(nums) - 1
    while left <= right:
        mid = left + (right - left) // 2
        if nums[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return left

这个实现有几个关键点：

当nums[mid] == target时，我们仍然执行right = mid - 1，继续向左搜索
循环结束时，left指向的可能是目标值的第一个位置
需要检查left是否越界以及nums[left]是否确实等于target

2.2 查找右边界的实现

查找右边界的逻辑与左边界类似，但方向相反：

python复制def find_right_bound(nums, target):
    left, right = 0, len(nums) - 1
    while left <= right:
        mid = left + (right - left) // 2
        if nums[mid] <= target:
            left = mid + 1
        else:
            right = mid - 1
    return right

关键点：

当nums[mid] == target时，我们执行left = mid + 1，继续向右搜索
循环结束时，right指向的可能是目标值的最后一个位置
同样需要检查right是否越界以及nums[right]是否等于target

2.3 完整解决方案

结合上述两个辅助函数，我们可以给出完整的解决方案：

python复制def searchRange(nums, target):
    def find_left(nums, target):
        left, right = 0, len(nums) - 1
        while left <= right:
            mid = left + (right - left) // 2
            if nums[mid] < target:
                left = mid + 1
            else:
                right = mid - 1
        return left
    
    def find_right(nums, target):
        left, right = 0, len(nums) - 1
        while left <= right:
            mid = left + (right - left) // 2
            if nums[mid] <= target:
                left = mid + 1
            else:
                right = mid - 1
        return right
    
    left_idx = find_left(nums, target)
    right_idx = find_right(nums, target)
    
    if left_idx <= right_idx and right_idx < len(nums) and nums[left_idx] == target and nums[right_idx] == target:
        return [left_idx, right_idx]
    return [-1, -1]

3. 边界条件与测试用例

3.1 常见边界情况

处理这类问题时，必须考虑以下边界情况：

空数组输入
目标值不存在于数组中
目标值只出现一次
目标值出现多次且连续
目标值出现在数组开头或结尾
目标值比所有元素都小或大

3.2 测试用例设计

完善的测试用例应该包括：

python复制test_cases = [
    ([5,7,7,8,8,10], 8, [3,4]),   # 常规情况
    ([5,7,7,8,8,10], 6, [-1,-1]), # 目标不存在
    ([], 0, [-1,-1]),             # 空数组
    ([1], 1, [0,0]),              # 单元素且匹配
    ([1], 2, [-1,-1]),            # 单元素不匹配
    ([2,2], 2, [0,1]),            # 全数组匹配
    ([1,3,5,7], 5, [2,2]),        # 单次出现
    ([1,3,5,7], 0, [-1,-1]),      # 小于最小值
    ([1,3,5,7], 9, [-1,-1])       # 大于最大值
]

4. 算法复杂度分析

4.1 时间复杂度

我们进行了两次二分查找：

查找左边界：O(log n)
查找右边界：O(log n)
总时间复杂度为O(log n) + O(log n) = O(log n)，满足题目要求。

4.2 空间复杂度

算法只使用了常数级别的额外空间，空间复杂度为O(1)。

5. 实际应用与优化技巧

5.1 工程实践中的应用

这种边界查找算法在实际工程中有广泛应用：

日志系统中查找特定时间范围
数据库查询优化
监控系统中的异常检测
用户行为分析中的事件追踪

5.2 优化技巧与注意事项

避免整数溢出：计算mid时使用left + (right - left) // 2而不是(left + right) // 2
循环条件：使用left <= right而不是left < right，确保处理所有情况
边界检查：在返回结果前务必检查索引是否有效
提前终止：如果第一次查找返回-1，可以直接返回[-1,-1]避免第二次查找
代码复用：可以将边界查找逻辑抽象为一个通用函数

提示：在实际面试中，面试官可能会要求解释为什么这种算法能正确工作。准备时应该能够清楚地说明循环不变量和终止条件。

6. 常见错误与调试技巧

6.1 常见实现错误

在找到目标值后立即返回，而不是继续搜索边界
没有正确处理目标值不存在的情况
循环条件设置错误导致死循环或提前终止
忘记检查最终结果的合法性（索引是否越界，值是否匹配）

6.2 调试方法

使用小规模测试用例手动模拟算法执行
打印每次循环的left, right, mid值
检查循环不变量是否始终保持
特别注意当nums[mid] == target时的处理逻辑

7. 变种问题与扩展思考

7.1 相关变种题目

查找第一个大于目标值的元素位置
查找最后一个小于目标值的元素位置
统计目标值在数组中出现的次数
在旋转排序数组中查找目标值

7.2 扩展思考

如果数组中有重复元素但未排序，如何高效解决？
如果数据量非常大且分布在多个节点上，如何设计分布式解决方案？
如何将这个算法应用于实时流数据处理？

在实际开发中，我经常需要处理类似的边界查找问题。一个实用的技巧是将边界查找算法封装成工具函数，这样在需要时可以快速调用。另外，在处理生产环境数据时，添加适当的日志和监控可以帮助快速定位边界条件问题。