LeetCode 637：二叉树层平均值的BFS解法与优化-代码聚汇网

LeetCode 637：二叉树层平均值的BFS解法与优化

CodeWarrioress

1. 问题理解与需求拆解

今天我们来解决LeetCode 637题——二叉树的层平均值。这道题看似简单，但其中蕴含着对二叉树遍历和数据处理的基本功考察。题目要求我们计算二叉树每一层节点的平均值，并以数组形式返回结果。

核心需求：给定一个非空二叉树的根节点root，返回一个数组，其中每个元素代表对应层节点的平均值。需要注意的是，结果需要保留5位小数，且与实际答案相差不超过10^-5的答案都被认为是正确的。

示例分析：

示例1中的输入[3,9,20,null,null,15,7]表示如下二叉树：

code复制    3
   / \
  9  20
    /  \
   15   7

第0层（根节点层）只有节点3，平均值自然是3.0
第1层有节点9和20，平均值是(9+20)/2=14.5
第2层有节点15和7，平均值是(15+7)/2=11.0

边界条件考虑：

单节点树：返回仅包含该节点值的数组
完全不平衡树（如所有节点只有左子树或只有右子树）
节点值包含极大或极小整数（-2^31到2^31-1）
节点数量上限（10^4个节点）

2. 解题思路与算法选择

解决这个问题最直观的思路是使用广度优先搜索（BFS），也就是层序遍历。这是因为题目要求按层处理节点，而BFS天然适合这种分层处理的需求。

为什么选择BFS而不是DFS？

BFS使用队列实现，可以自然地按层处理节点
DFS虽然也能实现分层，但需要额外记录节点层级信息，实现起来更复杂
BFS的时间复杂度与DFS相同（都是O(n)），但BFS的空间复杂度在最坏情况下（完全平衡树）更好

算法步骤分解：

初始化队列，将根节点放入队列
当队列不为空时：
a. 记录当前队列长度（即当前层的节点数）
b. 遍历当前层的所有节点，计算它们的值之和
c. 将每个节点的非空子节点加入队列
d. 计算当前层平均值并加入结果列表
返回结果列表

时间复杂度分析：

每个节点被访问一次，所以时间复杂度是O(n)，n是节点数量
空间复杂度取决于队列中最多存储的节点数，最坏情况下（完全平衡树）是O(n)

3. 代码实现与细节解析

让我们仔细分析给出的Python实现代码：

python复制from collections import deque

class Solution:
    def averageOfLevels(self, root: Optional[TreeNode]) -> List[float]:
        queue = deque([root])  # 初始化队列，放入根节点
        res = []  # 存储结果的列表
        
        while queue:  # 当队列不为空时循环
            level = []  # 存储当前层节点的值
            for _ in range(len(queue)):  # 处理当前层的所有节点
                node = queue.popleft()  # 取出队列头部节点
                level.append(node.val)  # 记录节点值
                if node.left:  # 如果有左子节点，加入队列
                    queue.append(node.left)
                if node.right:  # 如果有右子节点，加入队列
                    queue.append(node.right)
            # 计算当前层平均值，保留5位小数
            avg = sum(level) / len(level)
            res.append(float("{0:.5f}".format(avg)))
        return res

关键实现细节：

使用collections.deque作为队列，它的popleft()操作是O(1)时间复杂度，比列表的pop(0)更高效
for _ in range(len(queue))确保我们只处理当前层的节点，新加入的子节点不会在当前循环中被处理
平均值计算使用Python内置的sum()和len()函数，简洁高效
使用"{0:.5f}".format(avg)格式化输出，确保保留5位小数

格式化输出的注意事项：

题目要求结果与实际答案相差不超过10^-5
直接使用float类型可能会因为浮点数精度问题导致比较失败
格式化输出确保所有结果统一保留5位小数，避免精度问题

4. 测试用例与边界情况

为了确保代码的正确性，我们需要考虑各种测试用例：

基础测试用例：

python复制# 示例1
[3,9,20,null,null,15,7] → [3.00000,14.50000,11.00000]

# 示例2
[3,9,20,15,7] → [3.00000,14.50000,11.00000]

边界测试用例：

单节点树：

python复制[1] → [1.00000]

完全左斜树：

python复制[1,2,null,3,null,4,null] → [1.00000,2.00000,3.00000,4.00000]

大数测试：

python复制[2147483647,2147483647,2147483647] → [2147483647.00000,2147483647.00000]

多层树：

python复制# 一个4层的完全二叉树
[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15] → [1.00000,2.50000,5.50000,11.00000]

测试技巧：

使用LeetCode提供的可视化工具查看二叉树结构
对于自定义测试用例，可以先手工计算预期结果
特别注意null节点的处理，确保不会访问空节点的val属性

5. 算法优化与变种思考

虽然当前的BFS实现已经足够高效，但我们还可以考虑一些优化和变种：

优化1：避免使用中间列表
当前实现使用了一个level列表来存储当前层的所有值，这增加了O(n)的空间复杂度。我们可以改为直接累加：

python复制def averageOfLevels(self, root: Optional[TreeNode]) -> List[float]:
    queue = deque([root])
    res = []
    
    while queue:
        level_size = len(queue)
        level_sum = 0.0
        for _ in range(level_size):
            node = queue.popleft()
            level_sum += node.val
            if node.left: queue.append(node.left)
            if node.right: queue.append(node.right)
        res.append(float("{0:.5f}".format(level_sum / level_size)))
    return res

优化2：DFS实现
虽然BFS更直观，但DFS也可以解决这个问题，只需要记录每个节点的深度：

python复制def averageOfLevels(self, root: Optional[TreeNode]) -> List[float]:
    level_info = []  # 存储每层的[sum, count]
    
    def dfs(node, depth):
        if not node:
            return
        if depth >= len(level_info):
            level_info.append([0, 0])
        level_info[depth][0] += node.val
        level_info[depth][1] += 1
        dfs(node.left, depth + 1)
        dfs(node.right, depth + 1)
    
    dfs(root, 0)
    return [float("{0:.5f}".format(s / c)) for s, c in level_info]

变种思考：

如果要求返回每层的最大值而不是平均值？
如果要求返回每层的中位数而不是平均值？
如果树特别大（比如节点数超过10^6），如何优化内存使用？

6. 常见错误与调试技巧

在实现这个算法时，容易遇到以下几个常见错误：

错误1：忘记处理空树
虽然题目说明是非空二叉树，但在实际编程中还是应该考虑防御性编程：

python复制if not root:
    return []

错误2：浮点数精度问题
直接比较浮点数可能导致错误，应该使用题目允许的误差范围：

python复制# 不推荐
if avg == expected_avg:
    ...

# 推荐
if abs(avg - expected_avg) < 1e-5:
    ...

错误3：队列处理不当
在层序遍历中，常见的错误是在循环中错误地更新队列长度：

python复制# 错误写法
while queue:
    for i in range(len(queue)):  # 如果在循环内改变了queue长度，这会出问题
        node = queue.popleft()
        ...
        queue.append(node.left)  # 这会改变len(queue)

调试技巧：

打印每层的节点值和计算结果
使用小规模的测试用例手动验证
特别注意边界条件，如单层只有一个节点的情况

7. 实际应用与扩展

这道题虽然简单，但它涉及的二叉树层序遍历是许多实际应用的基础：

实际应用场景：

社交网络中的层级关系分析
组织结构图的层级统计
游戏中的AI决策树评估
文件系统的目录结构分析

扩展思考：

如何并行计算各层的平均值？（考虑使用多线程处理不同层级）
如果树是动态变化的，如何高效维护层平均值？（考虑增量计算）
如何可视化各层平均值的分布？（可以结合matplotlib等库）

性能优化进阶：
对于特别大的树，可以考虑：

使用迭代而非递归的DFS实现，避免栈溢出
使用更高效的数据结构，如双端队列
对于已知深度的树，可以预分配结果数组空间

8. 编码风格与最佳实践

在实现这类算法题时，良好的编码风格很重要：

变量命名：

使用有意义的变量名，如level_sum比s更好
遵循Python的命名约定（小写加下划线）

代码组织：

将算法逻辑封装在单独的函数中
使用辅助函数处理复杂逻辑
添加必要的注释，特别是非直观的操作

Python特有技巧：

使用deque比list更高效
使用_作为循环变量名表示不关心该变量
格式化字符串使用f-string（Python 3.6+）：

python复制avg = float(f"{sum(level)/len(level):.5f}")

防御性编程：

检查输入有效性
处理可能的异常情况
添加类型注解提高代码可读性

9. 总结与个人心得

通过这道题目，我们巩固了几个重要的编程和算法概念：

二叉树的层序遍历（BFS）实现
队列数据结构的使用技巧
浮点数精度处理
边界条件考虑

在实际面试中，这类题目常常作为热身题出现，面试官可能会要求：

解释算法的时间和空间复杂度
讨论可能的优化方案
扩展问题的解决方案

我个人在解决这个问题时的体会是：

初始实现时容易忽略浮点数精度要求
BFS的队列处理需要特别注意循环条件
测试用例的设计非常重要，特别是各种边界情况

最后分享一个小技巧：在LeetCode上提交前，可以先在本地用多个测试用例验证，包括：

空树（虽然题目说非空，但防御性编程很重要）
单节点树
完全不平衡的树
节点值包含最大最小整数的树