师徒排名算法：邻接表与DFS实战解析

兔尾巴老李

1. 问题背景与需求分析

最近在准备算法面试时遇到一个有趣的师徒排名问题，题目要求我们统计每个师傅手下有多少徒弟的排名超过了自己。这类关系型数据处理在实际开发中很常见，比如社交网络中的影响力分析、企业组织架构中的汇报关系等。

问题的核心在于：给定一组师徒关系对[[师傅排名, 徒弟排名],...]，需要计算每个师傅对应的"比自己强的徒弟"数量。这里的"强"指的是排名更高（数字更小）。例如输入[[2,1],[3,2]]，输出应该是[0,1,2]，表示：

排名1的师傅：0个徒弟超过他
排名2的师傅：1个徒弟（排名1）超过他
排名3的师傅：2个徒弟（排名1和2）超过他

2. 数据结构设计与关系建模

2.1 师徒关系图的表示

我们需要将输入的师徒关系对转换为更易处理的数据结构。最直观的方式是使用邻接表（Adjacency List）来表示这个有向图：

python复制{
    1: [4, 3],  # 排名1的师傅有排名4和3的徒弟
    2: [4, 1],  # 排名2的师傅有排名4和1的徒弟
    3: [2],     # 排名3的师傅有排名2的徒弟
    4: []       # 排名4的师傅没有徒弟
}

这种表示方法有几个优点：

快速查找某个师傅的所有直接徒弟
内存效率高，只存储实际存在的关系
方便进行图的遍历操作

2.2 处理循环依赖的特殊情况

在实际场景中，可能会出现循环依赖（A是B的师傅，B又是A的师傅）。我们需要在算法中检测并处理这种情况：

python复制if c == src:  # 发现循环依赖
    return 0  # 中断当前统计分支

这种处理方式确保了算法不会陷入无限递归，同时也符合业务逻辑——循环依赖在师徒关系中是不合理的。

3. 核心算法实现与优化

3.1 递归遍历算法设计

算法的核心思想是通过深度优先搜索（DFS）遍历师徒关系图：

初始化一个空集合highC来存储比当前师傅强的徒弟
遍历当前师傅的所有直接徒弟：
- 如果徒弟排名更高（数字更小），加入highC
- 递归检查该徒弟的徒弟（间接关系）
最终返回highC的大小

python复制def getHighC(fa, f, src, highC):
    if f == 1:  # 排名第1的师傅不可能有更强的徒弟
        return 0
        
    for c in fa[f]:
        flag = True
        if c < src:  # 发现更强的徒弟
            if c not in highC:
                highC.add(c)
            else:  # 避免重复统计
                flag = False
        elif c == src:  # 循环依赖
            return 0
            
        if flag:
            getHighC(fa, c, src, highC)
    
    return len(highC)

3.2 剪枝优化策略

在极端情况下（如深度很大的师徒链），直接递归可能导致性能问题。我们通过两种优化提升效率：

记忆化搜索：使用集合highC记录已统计的徒弟，避免重复处理
提前终止：当遇到排名第1的师傅时立即返回，因为不可能有更强的徒弟

提示：在实际面试中，能够指出这些优化点会大大加分。即使时间有限不能完整实现，也应该说明优化思路。

4. 多语言实现对比

4.1 Python实现要点

Python版本充分利用了字典和集合的特性，代码简洁：

python复制fa = {}
for f, c in relations:
    fa.setdefault(f, []).append(c)
    fa.setdefault(c, [])  # 确保所有师傅都有记录

特点：

使用setdefault简化字典初始化
递归函数直接修改集合参数，利用Python的可变对象特性
最终结果排序使用lambda表达式

4.2 Java实现注意事项

Java版本需要更多样板代码，但类型安全：

java复制HashMap<Integer, ArrayList<Integer>> fa = new HashMap<>();
for (Integer[] relation : relations) {
    fa.putIfAbsent(relation[0], new ArrayList<>());
    fa.putIfAbsent(relation[1], new ArrayList<>());
    fa.get(relation[0]).add(relation[1]);
}

关键点：

使用putIfAbsent初始化列表
需要显式处理泛型类型
递归时需要传递所有参数（Java是值传递）

4.3 JavaScript实现技巧

JS版本适合前端场景：

javascript复制const fa = {};
for (let relation of relations) {
    const [f, c] = relation;
    fa[f] ? fa[f].push(c) : (fa[f] = [c]);
    fa[c] ? null : (fa[c] = []);
}

特点：

使用三元运算符简化条件赋值
数组解构使代码更清晰
需要处理Node.js的输入输出流

5. 测试用例设计与验证

5.1 基础测试用例

python复制输入: [[2,1],[3,2]]
预期输出: [0,1,2]

这个简单用例验证：

直接师徒关系的统计
间接关系的传递性
输出顺序的正确性

5.2 复杂关系测试

python复制输入: [[1,4],[1,3],[2,4],[2,1],[3,2],[4,5],[5,3]]
预期输出: [0,1,2,1,0]

这个用例验证：

多重间接关系
循环依赖处理
深度递归的正确性

5.3 边界条件测试

python复制输入: []
预期输出: []

输入: [[1,2]]
预期输出: [0,0]

验证：

空输入处理
最小师徒关系
默认值设置

6. 常见问题与调试技巧

6.1 重复统计问题

在最初的实现中，可能会重复统计间接关系。例如：

code复制A → B → C
A → C

如果不做去重，C会被统计两次。解决方案是使用集合而不是列表来存储结果。

6.2 栈溢出风险

深度递归可能导致栈溢出，特别是当师徒关系形成长链时。虽然题目中的排名数字通常不会太大，但在实际工程中可以考虑：

改用迭代方式实现DFS
设置最大递归深度限制
使用尾递归优化（如果语言支持）

6.3 性能优化建议

对于大规模数据（如数万条关系），可以考虑：

预先计算并缓存结果
使用并查集（Union-Find）优化关系查询
采用并行处理（如MapReduce）

7. 实际应用场景扩展

这个算法可以应用于多种实际场景：

组织架构分析：统计每个管理者下属中有多少人绩效更好
社交网络分析：计算每个人的"影响力指数"
竞赛排名系统：追踪选手的"击败关系"

例如在电商平台中，可以用类似算法分析：

每个销售主管下属中有多少销售员的业绩更好
商品之间的替代关系网络
用户推荐关系的价值评估

8. 算法复杂度分析

设n为师傅数量，m为关系数量：

时间复杂度：
- 构建邻接表：O(m)
- 统计每个师傅的结果：O(n) × O(m)（最坏情况）
- 总体：O(n×m)
空间复杂度：
- 存储邻接表：O(n+m)
- 递归栈深度：O(n)（最坏情况）

在实际应用中，师徒关系通常是树状或稀疏图，平均性能会比最坏情况好很多。

9. 代码风格与工程实践

9.1 可读性优化

为关键函数添加文档字符串：

python复制def getHighC(fa, f, src, highC):
    """
    统计比指定师傅强的徒弟数量
    
    :param fa: 师徒关系邻接表
    :param f: 当前处理的师傅
    :param src: 原始师傅（用于递归）
    :param highC: 已发现的强徒弟集合
    :return: 强徒弟数量
    """

使用有意义的变量名：

避免使用单个字母变量（除了简单的循环计数器）
teacher_to_students比fa更直观

9.2 单元测试建议

建立完善的测试套件：

python复制import unittest

class TestTeacherRank(unittest.TestCase):
    def test_basic_case(self):
        self.assertEqual(getResult([[2,1],[3,2]]), [0,1,2])
        
    def test_complex_case(self):
        self.assertEqual(getResult([[1,4],[1,3],[2,4],[3,2]]), [0,1,2,0])