图搜索算法：DFS与BFS原理及实现详解-代码聚汇网

图搜索算法：DFS与BFS原理及实现详解

易行男·龙大崇

1. 图搜索算法基础：从生活场景到计算机实现

第一次接触图搜索算法时，我正试图解决一个实际问题：如何在陌生的校园里找到从宿舍到图书馆的最短路径。这种日常生活中的寻路需求，恰恰是深度优先搜索(DFS)和广度优先搜索(BFS)最直观的应用场景。在计算机科学中，这两种算法构成了图遍历的基础，也是解决许多复杂问题的关键工具。

图论中的"图"概念与我们日常使用的地图非常相似。想象一下城市中的道路网络：交叉路口就是图中的"顶点"(Vertex)，连接路口的道路就是"边"(Edge)。计算机处理这类问题时，首先需要将这种网状结构转化为它能理解的数据形式，这就是图的存储结构要解决的问题。

2. 图的存储结构详解

2.1 邻接矩阵：直观的空间换时间方案

邻接矩阵是我最早接触的图存储方式，它的核心思想非常简单：用一个n×n的二维数组来表示图中n个顶点之间的连接关系。对于无权图，矩阵元素为1表示存在边，0表示不存在；对于有权图，则用具体权值代替1。

cpp复制const int N = 105;
int g[N][N]; // 邻接矩阵

int main() {
    int n, m; // 顶点数和边数
    cin >> n >> m;
    
    // 初始化邻接矩阵
    memset(g, 0, sizeof(g));
    
    // 读入边信息
    for (int i = 1; i <= m; i++) {
        int u, v, w;
        cin >> u >> v >> w;
        g[u][v] = w;
        g[v][u] = w; // 无向图需要双向赋值
    }
    
    // 查询与顶点x相邻的顶点
    int x;
    cin >> x;
    for (int i = 1; i <= n; i++) {
        if (g[x][i] != 0) {
            cout << "顶点" << x << "到顶点" << i 
                 << "的边权为：" << g[x][i] << endl;
        }
    }
    return 0;
}

邻接矩阵的优势在于：

查询任意两顶点间是否存在边只需O(1)时间
适合稠密图（边数接近顶点数平方的情况）
实现简单直观，适合教学和理解

但它的缺点也很明显：

空间复杂度O(n²)，对于稀疏图浪费严重
遍历某个顶点的所有邻接点需要O(n)时间，即使实际邻接点很少

实际工程中，当顶点数超过10000时，邻接矩阵往往会消耗过多内存，此时应考虑其他存储方式。

2.2 邻接表：灵活高效的主流选择

邻接表采用更聪明的存储策略：对每个顶点，只存储与之直接相连的顶点信息。这就像在校园地图上，为每个路口只记录直接连通的其他路口，而不是维护整个地图的完整矩阵。

cpp复制const int N = 1e5 + 5; // 更大的顶点容量
vector<pair<int, int>> adj[N]; // 邻接表，存储(邻接顶点, 边权)

int main() {
    int n, m;
    cin >> n >> m;
    
    for (int i = 1; i <= m; i++) {
        int u, v, w;
        cin >> u >> v >> w;
        adj[u].emplace_back(v, w);
        adj[v].emplace_back(u, w); // 无向图
    }
    
    int x;
    cin >> x;
    cout << "顶点" << x << "的邻接点：";
    for (auto [v, w] : adj[x]) {
        cout << v << "(边权" << w << ") ";
    }
    cout << endl;
    return 0;
}

邻接表的优势包括：

空间复杂度O(n+m)，特别适合稀疏图
遍历某个顶点的邻接点非常高效，时间复杂度等于实际邻接点数量
可以方便地存储附加信息（如边权）

我在实际项目中更倾向于使用邻接表，特别是处理社交网络、交通路线等稀疏图问题时。它的主要缺点是查询特定边是否存在需要遍历链表，不过大多数图算法都不需要频繁进行这种操作。

3. 深度优先搜索(DFS)深入解析

3.1 DFS的核心思想与实现

DFS就像走迷宫时选择的策略：沿着一条路一直走到底，直到走不通再回溯。这种"不撞南墙不回头"的方式用递归实现非常自然。

cpp复制vector<int> adj[N];
bool vis[N]; // 访问标记

void dfs(int u) {
    vis[u] = true;
    cout << "访问顶点：" << u << endl;
    
    for (int v : adj[u]) {
        if (!vis[v]) {
            dfs(v); // 递归深入
        }
    }
}

int main() {
    // 初始化图和vis数组...
    dfs(1); // 从顶点1开始DFS
    return 0;
}

DFS的非递归实现使用显式栈，避免了递归的栈溢出风险：

cpp复制void dfs_iterative(int start) {
    stack<int> s;
    s.push(start);
    vis[start] = true;
    
    while (!s.empty()) {
        int u = s.top();
        s.pop();
        cout << "访问顶点：" << u << endl;
        
        // 注意邻接点要逆序入栈以保证顺序一致
        for (auto it = adj[u].rbegin(); it != adj[u].rend(); ++it) {
            int v = *it;
            if (!vis[v]) {
                vis[v] = true;
                s.push(v);
            }
        }
    }
}

3.2 DFS的应用场景与实战技巧

连通分量检测：DFS非常适合查找图中的所有连通块。每次从未访问的顶点开始DFS，就能标记出一个连通分量。

cpp复制int count_components() {
    int cnt = 0;
    memset(vis, false, sizeof(vis));
    for (int u = 1; u <= n; u++) {
        if (!vis[u]) {
            dfs(u);
            cnt++;
        }
    }
    return cnt;
}

拓扑排序：对有向无环图(DAG)进行DFS后序遍历，逆序即为拓扑排序结果。
寻找桥和割点：通过记录DFS访问顺序和回溯值，可以高效找出图中的关键连接点。

实际调试DFS时，我习惯在递归入口和出口打印缩进的日志，这样可以清晰看到递归的深度和回溯过程。对于复杂问题，适当添加辅助数组记录中间状态也非常有帮助。

4. 广度优先搜索(BFS)全面剖析

4.1 BFS的算法原理与实现

BFS采取"层层推进"的策略，就像水波扩散一样从起点向外逐层探索。这种特性使它天然适合寻找最短路径问题。

cpp复制void bfs(int start) {
    queue<int> q;
    q.push(start);
    vis[start] = true;
    
    while (!q.empty()) {
        int u = q.front();
        q.pop();
        cout << "访问顶点：" << u << endl;
        
        for (int v : adj[u]) {
            if (!vis[v]) {
                vis[v] = true;
                q.push(v);
            }
        }
    }
}

BFS的一个关键变种是记录层数的实现方式，这在需要知道距离的应用中非常有用：

cpp复制void bfs_with_level(int start) {
    queue<int> q;
    q.push(start);
    vis[start] = true;
    vector<int> level(n+1, 0); // 记录每个顶点的层数
    
    while (!q.empty()) {
        int u = q.front();
        q.pop();
        cout << "顶点" << u << "位于层数：" << level[u] << endl;
        
        for (int v : adj[u]) {
            if (!vis[v]) {
                vis[v] = true;
                level[v] = level[u] + 1;
                q.push(v);
            }
        }
    }
}

4.2 BFS的典型应用与优化

无权图最短路径：BFS保证首次访问某个顶点时的路径就是最短路径。
扩散类问题：如迷宫逃脱、病毒传播模拟等场景。
双向BFS：当起点和终点都已知时，从两端同时进行BFS可以大幅减少搜索空间。

cpp复制int bidirectional_bfs(int start, int target) {
    if (start == target) return 0;
    
    queue<int> q1, q2;
    unordered_map<int, int> vis1, vis2;
    
    q1.push(start); vis1[start] = 0;
    q2.push(target); vis2[target] = 0;
    
    while (!q1.empty() && !q2.empty()) {
        // 从起点端扩展
        if (!q1.empty()) {
            int u = q1.front(); q1.pop();
            for (int v : adj[u]) {
                if (vis2.count(v)) {
                    return vis1[u] + 1 + vis2[v];
                }
                if (!vis1.count(v)) {
                    vis1[v] = vis1[u] + 1;
                    q1.push(v);
                }
            }
        }
        
        // 从终点端扩展
        if (!q2.empty()) {
            int u = q2.front(); q2.pop();
            for (int v : adj[u]) {
                if (vis1.count(v)) {
                    return vis2[u] + 1 + vis1[v];
                }
                if (!vis2.count(v)) {
                    vis2[v] = vis2[u] + 1;
                    q2.push(v);
                }
            }
        }
    }
    return -1; // 不连通
}

5. DFS与BFS的综合对比与选择策略

5.1 算法特性对比

特性	DFS	BFS
数据结构	栈（递归或显式栈）	队列
空间复杂度	O(h)，h为最大递归深度	O(w)，w为最宽层的宽度
时间复杂度	O(V+E)	O(V+E)
解的性质	不一定是最短路径	保证无权图中的最短路径
适用场景	拓扑排序、连通性检测、回溯问题	最短路径、扩散问题、层序遍历

5.2 选择策略与实战经验

当需要寻找所有可能解时：DFS更适合，如排列组合、子集生成等问题。它的回溯特性可以系统地探索所有可能性。
当需要最短路径时：BFS是首选，特别是无权图或边权相同的情况。对于加权图，则需要Dijkstra等更复杂的算法。
空间考虑：在深度很大的树或图中，DFS可能面临栈溢出风险，此时应使用迭代DFS或BFS。
特殊问题需求：如检测环路使用DFS，二部图检测使用BFS染色法等。

我在解决实际问题时，通常会先分析问题的性质：

如果需要"尽可能深"的探索（如走迷宫找到出口而不关心步数），选择DFS
如果需要"尽可能广"的覆盖（如社交网络中的好友推荐），选择BFS
有时甚至会结合使用两种算法，如IDA*等启发式搜索

6. 实战演练：文献查找问题

让我们用洛谷P5318题作为综合练习，完整实现DFS和BFS遍历：

cpp复制#include <iostream>
#include <vector>
#include <queue>
#include <algorithm>
#include <cstring>
using namespace std;

const int N = 1e5 + 5;
vector<int> adj[N];
bool vis[N];
int n, m;

void dfs(int u) {
    vis[u] = true;
    cout << u << " ";
    
    for (int v : adj[u]) {
        if (!vis[v]) {
            dfs(v);
        }
    }
}

void bfs(int start) {
    queue<int> q;
    q.push(start);
    vis[start] = true;
    
    while (!q.empty()) {
        int u = q.front();
        q.pop();
        cout << u << " ";
        
        for (int v : adj[u]) {
            if (!vis[v]) {
                vis[v] = true;
                q.push(v);
            }
        }
    }
}

int main() {
    cin >> n >> m;
    for (int i = 0; i < m; i++) {
        int u, v;
        cin >> u >> v;
        adj[u].push_back(v);
    }
    
    // 题目要求按编号从小到大访问，所以需要排序
    for (int i = 1; i <= n; i++) {
        sort(adj[i].begin(), adj[i].end());
    }
    
    memset(vis, false, sizeof(vis));
    dfs(1);
    cout << endl;
    
    memset(vis, false, sizeof(vis));
    bfs(1);
    cout << endl;
    
    return 0;
}

这个实现中有几个关键点需要注意：

题目要求按编号从小到大访问，所以需要对邻接表进行排序
DFS和BFS使用同一个vis数组，需要在两次遍历间重置
邻接表存储的是有向图，与前面无向图的实现有所不同

7. 高级应用与性能优化

7.1 迭代加深搜索(IDDFS)

当搜索树很深但解在较浅层时，可以结合DFS和BFS的优点：

cpp复制bool dls(int u, int depth, int limit) {
    if (depth > limit) return false;
    cout << u << " ";
    
    for (int v : adj[u]) {
        if (!vis[v]) {
            vis[v] = true;
            if (dls(v, depth+1, limit)) return true;
            vis[v] = false; // 回溯
        }
    }
    return false; // 本层未找到解
}

void iddfs(int start, int max_depth) {
    for (int limit = 0; limit <= max_depth; limit++) {
        memset(vis, false, sizeof(vis));
        vis[start] = true;
        if (dls(start, 0, limit)) break;
    }
}

7.2 并行化搜索

对于大规模图，可以考虑并行化BFS：

使用多线程处理不同层次的节点
使用CUDA等GPU加速技术进行矩阵运算
分布式计算框架如Pregel处理超大规模图

7.3 内存优化技巧

对于稀疏图，使用压缩稀疏行(CSR)格式存储邻接表
位图标记访问状态以减少内存占用
对于固定图结构，考虑使用内存池分配节点

8. 常见问题与调试技巧

8.1 典型错误排查

无限递归/循环：忘记设置vis标记或标记位置错误
错误的最短路径：在加权图中误用BFS
栈溢出：递归深度过大，应改用迭代实现
顺序错误：邻接表未排序导致遍历顺序不符合要求

8.2 调试日志建议

在算法关键点添加日志输出：

cpp复制void dfs_debug(int u, int depth) {
    vis[u] = true;
    cout << string(depth*2, ' ') << "进入顶点" << u << endl;
    
    for (int v : adj[u]) {
        if (!vis[v]) {
            dfs_debug(v, depth+1);
        } else {
            cout << string((depth+1)*2, ' ') << "顶点" << v << "已访问" << endl;
        }
    }
    
    cout << string(depth*2, ' ') << "离开顶点" << u << endl;
}

8.3 性能调优经验

对于大规模数据，使用更快的输入输出方式（如scanf/printf或关闭同步）
预分配足够内存避免vector多次扩容
使用位运算代替vis数组可以提升缓存命中率
考虑内存访问模式，尽量顺序访问数据

经过多年实践，我发现图搜索算法的关键在于深入理解问题本质，而非机械套用模板。每种算法都有其适用场景，优秀的开发者应该能够根据具体需求选择合适的工具，并针对性地进行优化。