Manacher算法：高效查找最长回文子串的线性解法-代码聚汇网

Manacher算法：高效查找最长回文子串的线性解法

阿丁的猫

1. Manacher算法概述

Manacher算法是一种用于在O(n)时间复杂度内查找字符串中最长回文子串的线性算法。它由Glenn K. Manacher在1975年提出，相比传统的中心扩展法（O(n²)）或后缀数组方法（O(n log n)），在效率上有显著提升。

核心思想：利用回文串的对称性质，通过维护一个"当前已知最右回文边界"来避免重复计算。

在实际应用中，Manacher算法常用于：

文本处理中的回文检测
DNA序列分析
密码学中的模式匹配
编程竞赛中的字符串处理问题

2. 算法核心原理

2.1 预处理：统一奇偶长度

原始字符串直接处理会遇到奇偶长度回文串的问题。Manacher通过插入特殊字符（通常用'#'）将原字符串转换为统一奇数长度的新字符串。

示例：
原字符串 "aba" → "#a#b#a#"
原字符串 "abba" → "#a#b#b#a#"

这种转换有两个优点：

统一处理奇偶长度回文
避免边界检查（首尾都插入特殊字符）

2.2 关键变量定义

算法维护三个核心变量：

p[i]：以i为中心的最长回文半径
center：当前能延伸到最右端的回文中心
right：当前已知回文串的最右边界

初始化：

cpp复制vector<int> p(n, 0);
int center = 0, right = 0;

2.3 对称性利用

对于当前位置i：

如果i在已知最右边界内（i < right），可以利用对称点j=2*center-i的值来初始化p[i]
否则从p[i]=1开始中心扩展

核心代码逻辑：

cpp复制if (i < right) {
    p[i] = min(right - i, p[2*center - i]);
}
// 中心扩展
while (s[i + p[i]] == s[i - p[i]]) {
    p[i]++;
}
// 更新最右边界
if (i + p[i] > right) {
    center = i;
    right = i + p[i];
}

3. 完整算法实现

3.1 C++实现示例

cpp复制string preProcess(string s) {
    string res = "#";
    for (char c : s) {
        res += c;
        res += '#';
    }
    return res;
}

int manacher(string s) {
    string t = preProcess(s);
    int n = t.size();
    vector<int> p(n, 0);
    int center = 0, right = 0;
    int max_len = 0;
    
    for (int i = 1; i < n; ++i) {
        int mirror = 2 * center - i;
        if (i < right) {
            p[i] = min(right - i, p[mirror]);
        }
        
        // 中心扩展
        while (i - p[i] - 1 >= 0 && i + p[i] + 1 < n 
               && t[i - p[i] - 1] == t[i + p[i] + 1]) {
            p[i]++;
        }
        
        // 更新最右边界
        if (i + p[i] > right) {
            center = i;
            right = i + p[i];
        }
        
        max_len = max(max_len, p[i]);
    }
    
    return max_len;
}

3.2 时间复杂度分析

虽然算法有嵌套循环，但内层while循环的总执行次数不会超过n次（因为right最多从0增长到n）。因此整体时间复杂度严格为O(n)。

空间复杂度：O(n)用于存储p数组。

4. 算法优化与细节

4.1 边界处理技巧

在实际编码中，可以通过以下方式简化边界检查：

在字符串首尾添加不同字符（如'^'和'$'）
使用string_view或指针运算避免越界

优化后的预处理：

cpp复制string preProcess(string s) {
    if (s.empty()) return "^$";
    string res = "^#";
    for (char c : s) {
        res += c;
        res += '#';
    }
    res += '$';
    return res;
}

4.2 并行计算优化

现代CPU支持SIMD指令，可以利用并行比较加速中心扩展过程。例如使用SSE/AVX指令集同时比较多个字符。

4.3 内存访问优化

p数组的访问模式具有空间局部性，可以优化缓存使用：

将p数组与字符串数据紧凑存储
使用缓存友好的数据结构

5. 实际应用与变种

5.1 查找所有回文子串

通过遍历p数组，可以找到所有回文子串：

cpp复制vector<string> findAllPalindromes(string s) {
    string t = preProcess(s);
    vector<int> p = manacherArray(t);
    vector<string> res;
    
    for (int i = 1; i < t.size() - 1; ++i) {
        if (p[i] > 1) {  // 长度至少为1的原字符串回文
            int start = (i - p[i]) / 2;
            int len = p[i];
            res.push_back(s.substr(start, len));
        }
    }
    
    return res;
}

5.2 最长回文前缀/后缀

修改算法可以高效解决：

最长回文前缀：在right首次到达字符串末尾时记录
最长回文后缀：在center移动过程中跟踪最右边界

5.3 回文自动机结合

对于需要频繁查询回文信息的场景，可以将Manacher与回文自动机结合，构建更强大的字符串处理工具。

6. 常见问题与调试技巧

6.1 典型错误排查

数组越界：
- 确保预处理后的字符串首尾有特殊字符
- 检查while循环的边界条件
错误的最大长度计算：
- 记住p[i]表示的是转换后字符串的半径
- 原字符串长度 = p[i]
对称点计算错误：
- 确认mirror = 2*center - i
- 检查mirror是否在有效范围内

6.2 性能调优建议

使用原生数组代替vector：

cpp复制int p[2*MAX_LEN+3];  // 静态分配

减少函数调用：
- 将preProcess内联
- 使用宏或模板展开关键循环

使用位运算优化：

cpp复制// 替代部分除法/乘法
int mirror = (center << 1) - i;

6.3 测试用例设计

建议包含以下测试场景：

空字符串
单字符字符串
全相同字符
无回文的长字符串
交替字符（如"ababababa"）
包含多个长回文的复杂字符串

示例测试用例：

cpp复制void test() {
    assert(manacher("") == 0);
    assert(manacher("a") == 1);
    assert(manacher("aa") == 2);
    assert(manacher("abcba") == 5);
    assert(manacher("abacaba") == 7);
    assert(manacher("bananas") == 5);
}

7. 算法比较与选择

7.1 与其他算法对比

算法	时间复杂度	空间复杂度	实现难度	适用场景
中心扩展	O(n²)	O(1)	简单	短字符串、简单需求
动态规划	O(n²)	O(n²)	中等	需要所有回文信息
后缀数组	O(n log n)	O(n)	困难	需要其他字符串操作
Manacher	O(n)	O(n)	中等	最长回文子串

7.2 选择建议

只需要最长回文子串 → Manacher
需要所有回文信息 → 动态规划
字符串很短（n<1000）→ 中心扩展
已有后缀数组结构 → 使用后缀数组方法

8. 扩展与进阶

8.1 多字符串回文问题

对于多个字符串的回文问题，可以：

用特殊字符连接各字符串
应用扩展的Manacher算法
注意处理跨字符串的回文判断

8.2 回文自动机构建

Manacher算法可以辅助构建回文自动机：

使用Manacher预处理字符串
根据回文半径信息构建自动机节点
优化转移边的建立过程

8.3 流式处理变种

对于数据流场景，可以修改Manacher算法：

维护滑动窗口
增量更新p数组
定期修剪历史数据

在实际项目中应用Manacher算法时，我发现最关键的优化点在于减少不必要的边界检查。通过精心设计预处理步骤，可以消除大部分边界条件判断，使核心算法逻辑更加清晰高效。另一个实用技巧是在处理超长字符串时，可以分段应用Manacher算法，然后合并结果，这对内存受限的环境特别有用。