二叉树遍历与重建：原理、实现与应用

楚沐风

1. 二叉树基础概念与遍历原理

二叉树是计算机科学中最基础也是最重要的数据结构之一。它由节点组成，每个节点最多有两个子节点，分别称为左子节点和右子节点。二叉树在算法设计中应用广泛，从文件系统到数据库索引，从编译器设计到机器学习算法，都能看到它的身影。

1.1 二叉树的三种基本遍历方式

**前序遍历（Pre-order Traversal）**遵循"根-左-右"的顺序：

首先访问根节点
然后递归遍历左子树
最后递归遍历右子树

前序遍历的一个典型应用场景是复制一棵树的结构，因为根节点总是第一个被访问的。

**中序遍历（In-order Traversal）**采用"左-根-右"的顺序：

先递归遍历左子树
然后访问根节点
最后递归遍历右子树

对于二叉搜索树(BST)，中序遍历会得到一个升序排列的序列，这是中序遍历最显著的特性。

**后序遍历（Post-order Traversal）**按照"左-右-根"的顺序：

先递归遍历左子树
然后递归遍历右子树
最后访问根节点

后序遍历常用于删除树节点或计算表达式树的值，因为子节点总是在父节点之前被处理。

1.2 遍历的递归实现原理

递归实现是理解二叉树遍历最直观的方式。以中序遍历为例：

cpp复制void inOrder(TreeNode *root) {
    if(root == NULL) return;  // 递归终止条件
    inOrder(root->left);     // 遍历左子树
    cout << root->data << " "; // 访问当前节点
    inOrder(root->right);    // 遍历右子树
}

递归调用的本质是利用函数调用栈来保存遍历的路径。当遇到空节点(NULL)时，递归开始回溯，完成整个遍历过程。

注意：递归实现虽然简洁，但在处理深度很大的树时可能导致栈溢出。在实际工程中，对于深度不确定的树结构，建议使用非递归的迭代实现。

2. 根据遍历序列重建二叉树

2.1 前序+中序重建二叉树

给定一棵二叉树的前序遍历和中序遍历序列，可以唯一确定这棵树的结构。这是二叉树算法中的一个经典问题。

重建算法步骤：

前序遍历的第一个元素是树的根节点
在中序遍历中找到这个根节点，它将序列分为左子树和右子树的中序遍历
根据左子树的长度，在前序遍历中确定左右子树的前序遍历
递归重建左右子树

cpp复制TreeNode* buildTree(string pre, string in) {
    if(pre.empty()) return NULL;
    
    char rootVal = pre[0];
    int rootPos = in.find(rootVal);
    
    TreeNode* root = new TreeNode(rootVal);
    root->left = buildTree(pre.substr(1, rootPos), in.substr(0, rootPos));
    root->right = buildTree(pre.substr(rootPos+1), in.substr(rootPos+1));
    
    return root;
}

2.2 后序+中序重建二叉树

类似地，给定后序和中序遍历序列也能重建二叉树，只是根节点位于后序遍历的最后一个位置。

关键点：

后序遍历的最后一个元素是根节点
中序遍历中根节点的位置划分左右子树
递归构建时需要注意子串的截取范围

2.3 层序遍历的特殊处理

层序遍历（Level-order Traversal）按照树的层级从上到下、从左到右访问节点。它需要使用队列作为辅助数据结构：

cpp复制void levelOrder(TreeNode* root) {
    if(root == NULL) return;
    
    queue<TreeNode*> q;
    q.push(root);
    
    while(!q.empty()) {
        TreeNode* current = q.front();
        q.pop();
        cout << current->data << " ";
        
        if(current->left) q.push(current->left);
        if(current->right) q.push(current->right);
    }
}

层序遍历在求二叉树的最大宽度、最短路径等问题中有重要应用。

3. 二叉搜索树(BST)的特性与应用

3.1 BST的基本性质

二叉搜索树是一种特殊的二叉树，满足：

左子树所有节点的值小于根节点的值
右子树所有节点的值大于根节点的值
左右子树也分别是二叉搜索树

这种性质使得BST的查找、插入和删除操作都能在平均O(log n)时间内完成。

3.2 BST的构建与验证

构建BST的过程就是不断插入节点的过程：

cpp复制TreeNode* insert(TreeNode* root, int val) {
    if(root == NULL) return new TreeNode(val);
    
    if(val < root->val) {
        root->left = insert(root->left, val);
    } else if(val > root->val) {
        root->right = insert(root->right, val);
    }
    // 如果val == root->val，根据具体需求处理
    
    return root;
}

验证一棵树是否是BST需要检查其中序遍历是否为升序序列，或者递归检查每个节点是否满足BST的性质。

3.3 BST的删除操作

BST的删除操作相对复杂，需要考虑三种情况：

删除叶子节点：直接删除
删除只有一个子节点的节点：用子节点替代
删除有两个子节点的节点：找到右子树的最小节点或左子树的最大节点替代

cpp复制TreeNode* deleteNode(TreeNode* root, int key) {
    if(root == NULL) return NULL;
    
    if(key < root->val) {
        root->left = deleteNode(root->left, key);
    } else if(key > root->val) {
        root->right = deleteNode(root->right, key);
    } else {
        // 找到要删除的节点
        if(root->left == NULL) return root->right;
        if(root->right == NULL) return root->left;
        
        // 有两个子节点的情况
        TreeNode* minNode = findMin(root->right);
        root->val = minNode->val;
        root->right = deleteNode(root->right, minNode->val);
    }
    return root;
}

4. 二叉树常见问题与解题技巧

4.1 二叉树深度与平衡性

计算二叉树的深度是基础问题：

cpp复制int maxDepth(TreeNode* root) {
    if(root == NULL) return 0;
    return 1 + max(maxDepth(root->left), maxDepth(root->right));
}

判断二叉树是否平衡（左右子树高度差不超过1）：

cpp复制bool isBalanced(TreeNode* root) {
    return checkHeight(root) != -1;
}

int checkHeight(TreeNode* root) {
    if(root == NULL) return 0;
    
    int leftHeight = checkHeight(root->left);
    if(leftHeight == -1) return -1;
    
    int rightHeight = checkHeight(root->right);
    if(rightHeight == -1) return -1;
    
    if(abs(leftHeight - rightHeight) > 1) return -1;
    
    return 1 + max(leftHeight, rightHeight);
}

4.2 路径与求和问题

计算二叉树中从根到叶子节点的所有路径：

cpp复制void findPaths(TreeNode* root, vector<string>& paths, string current) {
    if(root == NULL) return;
    
    current += to_string(root->val);
    
    if(root->left == NULL && root->right == NULL) {
        paths.push_back(current);
        return;
    }
    
    current += "->";
    findPaths(root->left, paths, current);
    findPaths(root->right, paths, current);
}

求路径和等于给定值的路径：

cpp复制void pathSum(TreeNode* root, int sum, vector<vector<int>>& result, vector<int>& path) {
    if(root == NULL) return;
    
    path.push_back(root->val);
    
    if(root->left == NULL && root->right == NULL && root->val == sum) {
        result.push_back(path);
    }
    
    pathSum(root->left, sum - root->val, result, path);
    pathSum(root->right, sum - root->val, result, path);
    
    path.pop_back();
}

4.3 最近公共祖先(LCA)

寻找二叉树中两个节点的最近公共祖先：

cpp复制TreeNode* lowestCommonAncestor(TreeNode* root, TreeNode* p, TreeNode* q) {
    if(root == NULL || root == p || root == q) return root;
    
    TreeNode* left = lowestCommonAncestor(root->left, p, q);
    TreeNode* right = lowestCommonAncestor(root->right, p, q);
    
    if(left != NULL && right != NULL) return root;
    return left != NULL ? left : right;
}

对于BST，可以利用其有序性优化LCA查找：

cpp复制TreeNode* lowestCommonAncestorBST(TreeNode* root, TreeNode* p, TreeNode* q) {
    if(root->val > max(p->val, q->val)) {
        return lowestCommonAncestorBST(root->left, p, q);
    } else if(root->val < min(p->val, q->val)) {
        return lowestCommonAncestorBST(root->right, p, q);
    } else {
        return root;
    }
}

5. 二叉树算法的优化与实践技巧

5.1 非递归遍历实现

虽然递归实现简洁，但非递归实现通常效率更高且不会出现栈溢出问题。

非递归前序遍历：

cpp复制vector<int> preorderTraversal(TreeNode* root) {
    vector<int> result;
    stack<TreeNode*> s;
    if(root) s.push(root);
    
    while(!s.empty()) {
        TreeNode* node = s.top();
        s.pop();
        result.push_back(node->val);
        
        if(node->right) s.push(node->right);
        if(node->left) s.push(node->left);
    }
    return result;
}

非递归中序遍历：

cpp复制vector<int> inorderTraversal(TreeNode* root) {
    vector<int> result;
    stack<TreeNode*> s;
    TreeNode* curr = root;
    
    while(curr != NULL || !s.empty()) {
        while(curr != NULL) {
            s.push(curr);
            curr = curr->left;
        }
        
        curr = s.top();
        s.pop();
        result.push_back(curr->val);
        curr = curr->right;
    }
    return result;
}

5.2 序列化与反序列化

将二叉树转换为字符串表示（序列化）和从字符串重建二叉树（反序列化）是实际工程中的常见需求。

前序遍历序列化：

cpp复制string serialize(TreeNode* root) {
    if(root == NULL) return "#";
    return to_string(root->val) + "," + serialize(root->left) + "," + serialize(root->right);
}

TreeNode* deserialize(string data) {
    queue<string> q;
    stringstream ss(data);
    string item;
    
    while(getline(ss, item, ',')) {
        q.push(item);
    }
    
    return helper(q);
}

TreeNode* helper(queue<string>& q) {
    string val = q.front();
    q.pop();
    
    if(val == "#") return NULL;
    
    TreeNode* root = new TreeNode(stoi(val));
    root->left = helper(q);
    root->right = helper(q);
    
    return root;
}

5.3 莫里斯遍历(Morris Traversal)

莫里斯遍历是一种空间复杂度为O(1)的遍历方法，它通过临时修改树的结构来实现遍历。

中序莫里斯遍历：

cpp复制vector<int> inorderTraversal(TreeNode* root) {
    vector<int> result;
    TreeNode* curr = root;
    
    while(curr != NULL) {
        if(curr->left == NULL) {
            result.push_back(curr->val);
            curr = curr->right;
        } else {
            TreeNode* predecessor = curr->left;
            while(predecessor->right != NULL && predecessor->right != curr) {
                predecessor = predecessor->right;
            }
            
            if(predecessor->right == NULL) {
                predecessor->right = curr;
                curr = curr->left;
            } else {
                predecessor->right = NULL;
                result.push_back(curr->val);
                curr = curr->right;
            }
        }
    }
    return result;
}