线段树与树状数组实现区间修改与求和

Clark Liew

1. 问题背景与核心需求

区间修改与区间求和是算法竞赛中最经典的数据结构问题之一，也是蓝桥杯等编程赛事的高频考点。题目1133要求我们实现一个数据结构，能够高效处理以下两种操作：

对数组某个区间内的所有元素进行增减操作（区间修改）
快速查询数组某个区间内所有元素的和（区间求和）

这类问题在真实业务场景中非常常见，比如：

电商平台的库存批量调整
游戏开发中的区域属性更新
金融系统中的账户余额批量操作

2. 解决方案选型分析

2.1 暴力解法及其局限性

最直观的解法是直接遍历区间进行修改和求和：

python复制# 区间修改
for i in range(l, r+1):
    arr[i] += value

# 区间求和
total = 0
for i in range(l, r+1):
    total += arr[i]

时间复杂度：修改O(n)，查询O(n)
当n达到1e5量级时，这种解法显然无法满足要求。

2.2 线段树方案详解

线段树是解决此类问题的标准数据结构，它将区间信息存储在二叉树结构中，每个节点代表一个区间。

2.2.1 线段树节点设计

python复制class SegmentTreeNode:
    def __init__(self, l, r):
        self.l = l       # 区间左边界
        self.r = r       # 区间右边界
        self.left = None  # 左子节点
        self.right = None # 右子节点
        self.sum = 0      # 区间和
        self.lazy = 0     # 延迟标记

2.2.2 建树过程

python复制def build(l, r, arr):
    node = SegmentTreeNode(l, r)
    if l == r:
        node.sum = arr[l]
        return node
    
    mid = (l + r) // 2
    node.left = build(l, mid, arr)
    node.right = build(mid+1, r, arr)
    node.sum = node.left.sum + node.right.sum
    return node

建树时间复杂度：O(n)

2.3 区间修改的延迟传播

线段树的核心优化在于延迟标记（lazy tag）：

python复制def push_down(node):
    if node.lazy != 0:
        if node.left:
            node.left.sum += node.lazy * (node.left.r - node.left.l + 1)
            node.left.lazy += node.lazy
        if node.right:
            node.right.sum += node.lazy * (node.right.r - node.right.l + 1)
            node.right.lazy += node.lazy
        node.lazy = 0

def range_update(node, l, r, val):
    if node.r < l or node.l > r:
        return
    if l <= node.l and node.r <= r:
        node.sum += val * (node.r - node.l + 1)
        node.lazy += val
        return
    
    push_down(node)
    range_update(node.left, l, r, val)
    range_update(node.right, l, r, val)
    node.sum = node.left.sum + node.right.sum

修改时间复杂度：O(logn)

2.4 区间查询实现

python复制def range_query(node, l, r):
    if node.r < l or node.l > r:
        return 0
    if l <= node.l and node.r <= r:
        return node.sum
    
    push_down(node)
    return range_query(node.left, l, r) + range_query(node.right, l, r)

查询时间复杂度：O(logn)

3. 树状数组的差分实现方案

3.1 差分数组原理

对于数组a，定义差分数组d：

d[i] = a[i] - a[i-1] (i≥1)
d[0] = a[0]

区间[l,r]加val等价于：

d[l] += val
d[r+1] -= val (if r+1 < n)

3.2 树状数组实现

python复制class FenwickTree:
    def __init__(self, size):
        self.n = size
        self.tree = [0] * (self.n + 2)
    
    def update(self, idx, delta):
        while idx <= self.n:
            self.tree[idx] += delta
            idx += idx & -idx
    
    def query(self, idx):
        res = 0
        while idx > 0:
            res += self.tree[idx]
            idx -= idx & -idx
        return res

# 区间修改
def range_add(ft1, ft2, l, r, val):
    ft1.update(l, val)
    ft1.update(r+1, -val)
    ft2.update(l, val * (l-1))
    ft2.update(r+1, -val * r)

# 区间查询
def range_sum(ft1, ft2, l, r):
    def prefix_sum(idx):
        return ft1.query(idx) * idx - ft2.query(idx)
    return prefix_sum(r) - prefix_sum(l-1)

该方案同样实现O(logn)的修改和查询。

4. 两种方案的对比与选择

特性	线段树	树状数组
时间复杂度	O(logn) 修改/查询	O(logn) 修改/查询
空间复杂度	O(4n)	O(2n)
代码复杂度	较高	较低
扩展性	支持更多区间操作	主要适合求和
调试难度	较高	较低

实际比赛建议：如果只需要区间加减和求和，优先选择树状数组；如果需要处理更复杂的区间操作（如最值、GCD等），则必须使用线段树。

5. 常见错误与调试技巧

5.1 线段树常见陷阱

区间边界错误：
- 确保查询/修改的区间[l,r]与节点区间正确匹配
- 特别注意叶子节点的处理（l == r的情况）
延迟标记未正确下传：
- 在任何向下访问子节点前必须先push_down
- 修改后记得更新父节点的sum值
数组大小不足：
- 线段树需要4倍原始数组大小
- 常见错误是只开2倍大小导致越界

5.2 树状数组实现要点

差分数组初始化：

python复制# 正确初始化方式
ft1 = FenwickTree(n)
ft2 = FenwickTree(n)
for i in range(1, n+1):
    range_add(ft1, ft2, i, i, arr[i-1])

1-based索引：
- 树状数组通常使用1-based索引
- 需要将输入的0-based索引转换为1-based
边界检查：
- 当r+1超过数组大小时，不需要执行d[r+1] -= val操作

6. 性能优化实战技巧

6.1 线段树优化

非递归实现：
- 使用数组而非类来表示树结构
- 通过位运算加速节点访问
动态开点：
- 对于稀疏数据或超大区间，动态创建节点节省内存
标记永久化：
- 某些场景下可以省略push_down操作

6.2 树状数组变种

多维树状数组：

可以扩展到二维区间操作

python复制class FenwickTree2D:
    def __init__(self, rows, cols):
        self.rows = rows
        self.cols = cols
        self.tree = [[0]*(cols+1) for _ in range(rows+1)]

离线处理：
- 对于某些特殊问题，可以先将所有操作排序后处理

7. 实际应用案例扩展

7.1 动态排名系统

实现一个支持以下操作的系统：

将第x个学生的分数增加d分
查询分数在[l,r]区间内的学生人数

解决方案：

python复制# 使用离散化+树状数组
def solve():
    import bisect
    n = int(input())
    scores = list(map(int, input().split()))
    
    # 离散化
    sorted_scores = sorted(set(scores))
    mapping = {v:i+1 for i,v in enumerate(sorted_scores)}
    
    ft = FenwickTree(len(sorted_scores))
    for s in scores:
        ft.update(mapping[s], 1)
    
    # 查询[l,r]区间人数
    l_pos = bisect.bisect_left(sorted_scores, l)
    r_pos = bisect.bisect_right(sorted_scores, r)
    return ft.query(r_pos) - ft.query(l_pos)

7.2 游戏中的伤害区域计算

在RPG游戏中，需要实时计算：

对某个矩形区域内的所有怪物施加伤害
查询某个区域内怪物的总血量

解决方案：

python复制# 二维线段树实现
class SegmentTree2D:
    def __init__(self, matrix):
        self.matrix = matrix
        self.rows = len(matrix)
        if self.rows == 0: return
        self.cols = len(matrix[0])
        self.root = self.build(0, self.rows-1, 0, self.cols-1)
    
    def build(self, row1, row2, col1, col2):
        # 实现类似一维线段树的构建逻辑
        pass
    
    def range_update(self, row1, row2, col1, col2, delta):
        # 实现二维区间更新
        pass
    
    def range_query(self, row1, row2, col1, col2):
        # 实现二维区间查询
        pass

8. 算法模板与使用建议

8.1 线段树完整模板

python复制class SegmentTree:
    def __init__(self, data):
        self.n = len(data)
        self.size = 1
        while self.size < self.n:
            self.size <<= 1
        self.tree = [0] * (2 * self.size)
        self.lazy = [0] * (2 * self.size)
        
        # 初始化叶子节点
        for i in range(self.n):
            self.tree[self.size + i] = data[i]
        # 构建内部节点
        for i in range(self.size - 1, 0, -1):
            self.tree[i] = self.tree[2*i] + self.tree[2*i+1]
    
    def push(self, node, node_l, node_r):
        if self.lazy[node] != 0:
            mid = (node_l + node_r) // 2
            # 更新左子节点
            self.tree[2*node] += self.lazy[node] * (mid - node_l + 1)
            self.lazy[2*node] += self.lazy[node]
            # 更新右子节点
            self.tree[2*node+1] += self.lazy[node] * (node_r - mid)
            self.lazy[2*node+1] += self.lazy[node]
            # 清除当前节点标记
            self.lazy[node] = 0
    
    def range_add(self, l, r, val, node=1, node_l=0, node_r=None):
        if node_r is None:
            node_r = self.size - 1
        if r < node_l or l > node_r:
            return
        if l <= node_l and node_r <= r:
            self.tree[node] += val * (node_r - node_l + 1)
            self.lazy[node] += val
            return
        self.push(node, node_l, node_r)
        mid = (node_l + node_r) // 2
        self.range_add(l, r, val, 2*node, node_l, mid)
        self.range_add(l, r, val, 2*node+1, mid+1, node_r)
        self.tree[node] = self.tree[2*node] + self.tree[2*node+1]
    
    def range_query(self, l, r, node=1, node_l=0, node_r=None):
        if node_r is None:
            node_r = self.size - 1
        if r < node_l or l > node_r:
            return 0
        if l <= node_l and node_r <= r:
            return self.tree[node]
        self.push(node, node_l, node_r)
        mid = (node_l + node_r) // 2
        return self.range_query(l, r, 2*node, node_l, mid) + \
               self.range_query(l, r, 2*node+1, mid+1, node_r)