本文记录最长回文子串问题的五种解决方法,包括:
问题 ¶
从给定的字符串 s
中找到最长的回文子串的长度。
例如 s = "babbad"
的最长回文子串是 "abba"
,长度是 4
。
回文串的判断 ¶
首先,回文串的判断方法是简单的:从两边向中间,不断比较头尾字符是否相同即可。
判断回文串 - C 语言实现
// 判断给定字符串是否是回文串
bool IsPalindromicString(char *s) {
int n = strlen(s);
int left = 0;
int right = n - 1;
while (left < right) {
if (s[left] == s[right]) {
left++;
right--;
} else {
return false;
}
}
return true;
}
时间复杂度是 $O(n)$ 。
中心扩展方法 ¶
中心扩展方法的思路是非常自然的:
遍历每一个字符,向两边扩展找到以其为中心的最长回文子串, 所有找到的回文子串的最大长度即所求 。
不过,以当前字符为中心的回文串的长度可能是奇数,也可能是偶数,两种情况都需要考察:
奇数的情况:
偶数的情况:
两种情况的扩展起始点和回文串的计算方式是不同的。
显然,这种方法的时间复杂度是 $O(n^2)$ 。
最长回文子串 - 中心扩展法 - C 语言实现
// 辅助函数:从长度为 n 的字符串 s 的给定位置左右扩展寻找回文串。
// 输入的 left 和 right 是扩展的左右起始位置。
// 返回扩展经过的字符数 k .
int ExpandPalindrome(char *s, int n, int left, int right) {
int k = 0;
while (left >= 0 && right < n) {
if (s[left] == s[right]) {
left--;
right++;
k++;
} else {
break;
}
}
return k;
}
// 返回给定字符串 s 的最长回文子串的长度
int LongestPalindromicSubstring(char *s) {
int n = strlen(s);
if (n <= 0) return 0;
// 记录最大回文子串的长度
// 一旦 s 非空,必然最大回文子串长度至少为 1
int max_length = 1;
for (int i = 0; i < n; i++) {
// 考察回文串长度是奇数的情况
int k1 = ExpandPalindrome(s, n, i - 1, i + 1);
// 考察回文串长度是偶数的情况
int k2 = ExpandPalindrome(s, n, i, i + 1);
// 计算两个情况下的长度
int length1 = k1 * 2 + 1;
int length2 = k2 * 2;
// 更新最大值
if (length1 > max_length) max_length = length1;
if (length2 > max_length) max_length = length2;
}
return max_length;
}
一维动态规划方法 ¶
采用动态规划的方法,使用一个一维数组 dp
。
dp[j]
表示以位置 j
结束的最长的回文子串的起始位置 i
。
例如,在上图中,对于字符串 "aaabcbaba"
来说 dp[6] = 2
。
显然,对于非空字符串来说,有 dp[0] = 0
。
首先,需要证明一个结论:
递推过程中,当前项的回文串最多比上一项的回文串长一对字符 。
其原因可以做一般性验证:设 p(j)
是以位置 j
结尾的最长回文子串。
把 p(j)
的左右字符剔除,形成的子串 p'
显然也是一个回文串。
因为 p(j-1)
是以位置 j-1
结尾的最长回文串,所以回文串 p'
不可比 p(j-1)
长。
进而说明了 p(j)
至多比 p(j-1)
长一对字符。
现在,假设已知 dp[j-1]
,将考虑如何递推 dp[j]
,分两种情况:
当前位置的字符和上一次回文串的左邻字符相同,回文串得到扩展。
易知,
dp[j] = dp[j-1] - 1
。此外,由 前面的结论 可知,不会形成比它更长的回文串。
否则,回文串未得到扩展,但仍可能形成回文串,比如:
此时只能从左向右探测以位置
j
结尾的回文串。根据 前面的结论 ,可以从上一次回文串的起始位置开始探测。
探测的方法是,起两个变量
left
和right
对向比对字符:遇到不匹配的字符,把
right
拉回右边,因为要找的是以位置j
结尾的回文串。遇到匹配的两个字符,则左右继续靠拢:
直到左右变量相遇,就找到了一个回文串。
在遭遇左右不匹配的时候,除了重置
right
之外,可以用一个变量记录当时left
的位置, 这样在回文寻找完毕时,它就是回文串的起始位置,也就是dp[j]
。
至此,递推关系分析完成。
最后,易找出最长回文串和它的长度,不再详细讨论。
相比前两个方法,此方法理解稍复杂,是自己想到的一种新的方法。
最长回文子串 - 一维动态规划方法 - C 语言实现
// 返回给定字符串 s 的最长回文子串的长度
int LongestPalindromicSubstring(char *s) {
int n = strlen(s);
if (n <= 0) return 0;
// dp[j] 表示以位置 j 结尾的最长回文子串的起始位置
// 其长度就是 j - dp[j] + 1
int dp[n];
dp[0] = 0;
// 记录最大回文子串的长度
// 0 - 0 + 1
int max_length = 1;
for (int j = 1; j < n; j++) {
if (dp[j - 1] > 0 && s[j] == s[dp[j - 1] - 1]) {
// 当前位置的字符和上一次回文串的左邻字符相同
// 回文串得到扩展
dp[j] = dp[j - 1] - 1;
} else {
// 从左向右找
int left = dp[j - 1];
int right = j;
int start = left; // 最近一次的回文查找起始位置
while (left < right) {
if (s[left] != s[right]) {
// 遭遇失配字符,重置 right
right = j;
start = left + 1;
} else {
// 否则,两边继续收拢
right--;
}
left++;
}
dp[j] = start;
}
// 更新最大值
int length = j - dp[j] + 1;
if (length > max_length) max_length = length;
}
return max_length;
}
容易分析出来,这个算法的时间复杂度是 $O(n^2)$ 。
二维动态规划方法 ¶
相比 一维动态规划方法 而言, 二维数组上的动态规划方法的思路更直白。
回文串两边加上两个相同字符,会形成一个新的回文串 。
方法是,建立二维数组 dp
,找出所有的回文子串。
dp[i][j]
记录子串 i..j
是否为回文串 。
首先,单个字符就形成一个回文串,所以,所有 dp[i][i] = true
。
然后,容易得到递推关系:
如果字符 s[i]
和 s[j]
相等,并且子串 i+1..j-1
是回文串的话,子串 i..j
也是回文串。
也就是,如果 s[i] == s[j]
且 dp[i+1][j-1] = true
时,dp[i][j] = true
。
这是本方法中主要的递推关系。
不过仍要注意边界情况,即 子串 i+1..j-1
的有效性 ,当 i+1 <= j-1
时,它才有效。
反之,如果不满足,此时 j <= i+1
,也就是子串 i..j
最多有两个字符, 如果两个字符 s[i]
和 s[j]
相等,那么是回文串。
至此,递推关系已经分析完。
最后,考虑到 主要的递推关系 是由已知子串 i+1..j-1
的情况, 递推到 i..j
的情况, 因此,迭代过程需要反序迭代变量 i
,正序迭代 j
。
此外,可以通过一个表格,来理解整个 dp
数组的规划过程。
上面的表格填表过程:
- 初始化所有方格写
false
。 - 填写对角线写
true
。 - 自对角线右下角开始,自下而上、自左而右,按箭头方向根据递推关系填表。
最后,找到所有回文子串后,即可找到最长回文子串和其长度。
最长回文子串 - 二维动态规划法 - C 语言实现
// 返回给定字符串 s 的最长回文子串的长度
int LongestPalindromicSubstring(char *s) {
int n = strlen(s);
if (n <= 0) return 0;
// dp[i][j] 表示 s[i..j] 是否回文,j >= i
bool dp[n][n];
// 初始化
for (int i = 0; i < n; i++)
for (int j = i; j < n; j++) dp[i][j] = false;
// 易知,单个字符 s[i..i] 构成回文
for (int i = 0; i < n; i++) dp[i][i] = true;
// 记录最大回文子串的长度,至少为 1
int max_length = 1;
// 考虑递推
// 主要的递推关系是 dp[i][j] = dp[i+1][j-1]
// 所以倒序遍历 i ,才可以形成递推
for (int i = n - 1; i >= 0; i--) {
for (int j = i; j < n; j++) {
if (s[i] == s[j]) {
if (j - 1 >= i + 1) { // 子串 s[i+1..j-1] 有效性
if (dp[i + 1][j - 1]) dp[i][j] = true;
} else {
// 此时 j < i + 2 即 j <= i+1
// 再之 s[i] == s[j],必回文
dp[i][j] = true;
}
}
if (dp[i][j]) {
// 更新最大长度
int length = j - i + 1;
if (length > max_length) max_length = length;
}
}
}
return max_length;
}
此方法的时间复杂度是 $O(n^2)$ 。
前缀哈希法 + 二分 ¶
在读 《算法竞赛进阶指南》 这本书的时候发现的这个算法。
可以给字符串定义一种哈希方法,它满足这种性质:知道两个子串 a
和 b
的哈希值,就可以算出来它们的连接串 a+b
的哈希值。
反过来说:知道两个前缀子串 a
和 a+b
的哈希值,就可以算出来它们之间的区间子串 b
的哈希值。
BKDR 就是这样一种哈希算法,它的伪代码非常简单:
P = 131
hash(s)
h = 0
for ch in s
h = h * P + ch
return h
其中的 ch
也可以用更小的 ch-'a'+1
数值来替代,131
也可以换成 31
, 13131
之类的,具体看所要支持的字符集大小而定。
发挥下想象, 给一个字符串 s
追加一个字符 ch
的时候,哈希值的变化, 就相当于在 P
进制下左移一位再或上 ch
的值:
h = h * P + ch
= (h << 1) | ch // P 进制下的逻辑运算
那么,给一个字符串 s
追加一个长度为 k
的字符串 t
的时候,相当于把 t
的字符一个一个追加上去, 其哈希值的变化就相当于左移 k
位,再或上 hash(t)
:
hash(s+t) = hash(s) * P^k + hash(t) // 符号 ^ 在这里是幂的意思,不是异或
= hash(s) << k | hash(t) // P 进制下的逻辑运算
那么,如果知道一个字符串的两个前缀 s
和 s+t
,就可以知道它们之间的区间串的哈希值。 就好比 在 P
进制下左移 s
后右侧补零,然后用 s+t
的哈希值减去它 :
hash(t) = hash(s+t) - hash(s) * P^k
这是一个重要的结论:知道两个前缀的哈希值,就可以直接计算出其间的连续区间的哈希值。
如果我们预先处理一个字符串的所有前缀哈希,记录在数组中,那么它可以递推出来。 下面的代码实现了一个通用的 BKDR 函数:
前缀哈希类 Hash 的 C++ 实现
class Hash {
using ull = unsigned long long;
const ull P = 131; // P 的取值要保证覆盖字符集大小
private:
int n;
// h[i+1] 表示前缀 s[0..i] (前闭后闭) 的哈希值,特殊的:h[0] = 0
vector<ull> h;
vector<ull> p; // p[i] 就是 P^i 次方
public:
explicit Hash(const string& s)
: n(s.size()), h(vector<ull>(n + 1, 0)),
p(vector<ull>(n + 1, 0)) {
p[0] = 1; // power(P, 0) is 1
for (int i = 1; i <= s.size(); i++) {
// ch-'a'+1 的保证大于 0, 避开特殊的哈希零值
h[i] = h[i - 1] * P + (s[i - 1] - 'a' + 1);
p[i] = p[i - 1] * P;
}
}
// 计算字符串区间 s[i..j] 的哈希值, 前闭后闭
// 取前缀 A = h[j+1] 减去前缀 B = h[(i-1)+1]
// 在 P 进制下,左移 B 和 A 左端对其,然后相减, 定义为 [i..j] 区间的哈希值
// 即 A - B * P ^ (j-i+1) (这里 ^ 符号是幂的意思)
// 要保证传入的 j >= i
ull sub(int i, int j) { return h[j + 1] - h[i] * p[j - i + 1]; }
};
接下来,有了这些铺垫,就可以 nlogn
的复杂度来求解最长回文子串了。
显然可以知道,回文串的中心位置,在长度为奇数和偶数的情况下,是有不同的。 前者的情况下,中心在一个字符上。偶数的情况下,中心在两个字符之间,不便于程序编写。
我们直接在字符串的任意间隔处和两边都插入特殊的 #
,来消除奇偶问题。
而且,可以试一试奇偶情况,预处理之后会有:
- 回文串的长度一定是奇数,中心一定在一个字符上。
除去中心字符,左右两边的对称部分长度记作
L
,它就是原始字符串中的最长回文长度。在后面的马拉车算法中,它也会叫做回文半径的概念。
现在,给出算法的主流程:
- 预先计算字符串 s1 的前缀哈希 h1 。
- 反转字符串记作 s2 ,并计算其前缀哈希 h2 。
迭代每个字符,二分枚举可能的半径 L,直到满足:
s1 中当前位置左边的长度为
L
的区间的哈希值 等于 s2 中相应位置左边的长度位 L 的区间的哈希值。 即,在位置i
二分查找直到:hash(s1[i-L..i-1]) == hash(s2[j-L..j-1])
,其中j=n-1-i
。- 取所有位置上的 L 之最大者为答案。
看起来很复杂,看下图的例子,要比较哈希值的两个区间是图中 红色、和 蓝色边框 的两个部分:
但是为什么可以二分呢?
因为回文串有一个性质,如果对于一个回文半径 L
,满足左右两边相等,那么更小的 L
来说,肯定也左右两边相等。 但是 L
总有一个上界,超过这个值之后,两边就不再相等。
这好比在前面都是 1
、后面全是 0
的一个数组里找最后一个 1
出现的位置一样,可以采用二分来枚举答案。
所以 我们可以从最大的可能的 L
,来向下二分枚举,找到这个界限,就是在这个中心位置处的最大的回文半径。
每次枚举 L
的上界,应该根据当前中心位置来考虑,回文半径不应越界,具体不再赘述。
简而言之,伪代码如下:
// 迭代中心位置 i
for i in n
j = n - i - 1
// 二分从大到小枚举 L
l = 0, r = min(n/2, i, j)
while (l < r)
m = (l+r+1)/2
if h1(s1[i-m..i-1]) != h2(s2[j-m..j-1]) r = m - 1
else l = m
L = max(L, l)
return L
容易知道,其时间复杂度是 $O(n\log{n})$ 。
C++ 的代码实现如下:
最长回文子串 - 前缀哈希+二分法 C++ 实现
class Solution {
public:
int longestPalindrome(string s) {
string s1("#");
// 插入 '#' 消除奇偶问题
for (auto ch : s) {
s1.push_back(ch);
s1.push_back('#');
}
int n = s1.size();
// 正向前缀哈希
Hash h1(s1);
// 逆向前缀哈希
string s2(s1.rbegin(), s1.rend());
Hash h2(s2);
// 对每个位置,二分从大到小查找以当前位置为中心的合适的回文子串的长度
// 因为随着枚举的长度的变小,一旦 hash
// 相等,再小也是会相等,所以可以二分
//
// +------------ N ----------------+
// | i |
// # c # a # b # c # b # a # d # f #
// 0 1 2 3 4 5 6 7
// +------ 2L+1 -------+
// max L=5
//
// 对于一个可能的长度 2L+1
// 只需要判断: hash(s1[i-L..i-1]) 和 hash(s2[j-L..j-1]), 其中 j=n-i-1
// 经过预处理后, 此时的 n 一定是奇数, L 的值不超过 min(n/2, i)
int L = 0; // 追踪最大的 L
for (int i = 1; i < n - 1; i++) {
int j = n - i - 1;
// 从高向低,应用二分判定
int low = 0; // 长度的下限
// 长度的上限, 不超过一半的总长度、不超过左和右侧部分
int high = std::min({n / 2, i, j});
while (low < high) {
// 采用 +1 的形式的目的是为了考虑进去边界 high
int mid = (low + high + 1) >> 1;
if (h1.sub(i - mid, i - 1) != h2.sub(j - mid, j - 1)) {
// 说明枚举的长度太大了,需要继续严格减小
high = mid - 1;
} else
// 相等的情况,可能是最长的长度、但也可能比较小,为了找最长的长度
// 可以把它提升为下界,继续向上二分找
low = mid;
}
// 终止时 low == high
// 因为始终保证可行解在 [low, high]
// 闭区间内,所以此时 low == high 就是保证哈希值相等的地方
// 更新追踪的结果
if (L < low) L = low;
}
// L 就是原字符串 s 的最长回文长度
return L;
}
};
Manacher 方法 ¶
Manacher 算法 是一种线性时间内求解最长回文子串的算法,俗称「马拉车算法」。
Manacher 算法本身是面比较窄的算法,但背后其实也是基于动态规划思想的。
本部分内容较长、算法较复杂,需要精心阅读 。
算法分为两个过程:
- 预处理过程:通过插入分隔符的办法,把潜在的回文子串统一转为奇数长度。
- 算法主过程:构造回文半径数组,利用回文的对称性,递推回文半径。
预处理过程
预处理过程比较简单。
在原始字符串每个字符中间和整个字符串两边插入分隔符:
如果,原始字符串的长度是 $n$ ,那么预处理后的长度为 $2n + 1$ 。
预处理后,任意一个回文串都是奇数长度。
容易给出预处理部分的代码实现,其复杂度是 $O(n)$ 。
最长回文子串 - Manacher 算法 - 预处理 - C 语言实现
// 预处理过程,n 是原字符串 s 的长度
// 预期结果 s1 的长度是 2n + 1
// 例如 "aba" => "|a|b|a|"
void ManacherPreprocess(char *s, int n, char *s1) {
int i = 0;
int j = 0;
while (i < n) {
s1[j++] = '|';
s1[j++] = s[i++];
}
// 末尾补 '|'
s1[j++] = '|';
}
回文半径的概念
现在定义一个概念:
回文半径是回文串的中心字符到左边界的距离。
严格来说,是中心字符和左边界字符下标的差值。
简单来说,是 中心字符左边的字符个数 。
下图中的例子,绿色的回文串的半径是 p=2
。
可以发现,预处理后,回文半径就是原字符串中回文串的长度:
于是,接下来只需要考虑预处理后的字符串即可。
现在,建立一个回文半径的数组, p[i]
表示以位置 i
为中心的最长回文串的半径 。
找到数组 p
的最大值,就是原字符串的最长回文串的长度。
算法主过程
算法的主过程则是求解预处理后字符串的半径数组 p
,采用动态规划的方式。
首先,字符串第一位是分隔符,因此首位 p[0] = 0
。
下面考虑递推关系。
在求解半径数组 p
的过程中, 维护 向右延伸最远的回文串 的信息 。
假设我们处于求解 p[i]
的过程中, 下图中绿色的字符串就是要维护的 向右延伸最远的回文串 , 它的右边界是已知的回文串中最大的。
对于这种字符串,不妨叫做 最右延伸回文串 ,维护它的信息:
- 它的中心字符的位置
c
- 它的右边界位置
r
在求解 p[i]
的迭代过程中,一旦遇到右边界比 r
还要大的回文串,就更新 r
和 c
的值。
现在尝试寻找以 i
为中心的最长回文串 q
,它的长度是未知的,有如下几种可能:
下面对以上的情况逐个分析:
当
i < r
且q
被最右延伸回文串完全包住。找出
i
关于中心c
的对称位置j
,两边是完全镜像的,半径相等p[i] = p[j]
。当
i < r
,但是同时q
没有被完全包住。此时容易知道回文串
q
的半径不小于r-i
。综合第一种情况,可知, 当
i < r
时,p[i]
至少为min(p[j], r-i)
。不过,右边跨过
r
的部分仍然是未知的,需要采用中心扩展方法求出。已经知道,此时
p[i]
至少是r-i
,因此只需要从r+1
处开始扩展就行。当
i >= r
,此时,只能从位置i
处向两边中心扩展探测回文串。具体来说,先初始化半径
p[i] = 0
,然后不断尝试增加半径,判断左右字符是否相等。此时的中心扩展起点是
i+1
。
综合上面三种情况:
如果
i < r
,那么p[i]
至少为min(p[j], r-i)
。不妨让
p[i]
先取这个值,即先吸收已知信息。然后向右中心扩展,探测回文串的边界。
无论
i
和r
的大小关系如何,左右扩展的起点可以统一表示 ,都可以表达为:left = i - p[i] - 1
right = i + p[i] + 1
最终的递推关系,虽然分为三种情况,但是可以总结为:
先吸收已知的镜像半径长度,然后再中心扩展探测剩余长度 。
利用此递推关系,求解半径数组 p
,找出其中半径最大值,就是原字符串的最长回文串长度。
最长回文串 - Manacher 方法 - 算法主过程- C 语言实现
#define min(x, y) (x) < (y) ? (x) : (y)
// Manacher 算法主过程
// 输入长度为奇数的已预处理过的字符串 s 和其长度 n
// 返回最长回文串的半径
int Manacher(char *s, int n) {
// 最长回文串半径的数组
int p[n];
// 显然 第一位的半径是 0
p[0] = 0;
// 追踪数组 p 的最大值
int max_p = 0;
// 维护向右延伸最远的回文串的信息
// 其最右的位置 r
int r = 0;
// 其中心位置 c
int c = 0;
// 求解数组 p
for (int i = 1; i < n; i++) {
// 找出 i 为中心的回文串半径 p[i]
if (i < r) {
// 目标回文串的中心在 r 左边时
// 最大化吸收已有信息
// j 是 i 关于 c 对称的位置
int j = c - (i - c);
// p[i] 至少为下面二者最小值
p[i] = min(p[j], r - i);
} else {
// 否则,初始化 p[i]
p[i] = 0;
}
// 左右进行扩展,探测剩余长度
int left = i - p[i] - 1;
int right = i + p[i] + 1;
while (s[left] == s[right] && left >= 0 && right < n) {
left--;
right++;
p[i]++;
}
// 真实的 right
// 因上面的循环跳出后的 right 可能稍大
right = i + p[i];
// 维护 c 和 r
if (right > r) {
r = right;
c = i;
}
// 维护最大值
if (max_p < p[i]) max_p = p[i];
}
return max_p;
}
// 返回给定字符串 s 的最长回文子串的长度
int LongestPalindromicSubstring(char *s) {
int n = strlen(s);
if (n <= 0) return 0;
// 预处理
int n1 = 2 * n + 1;
char s1[n1];
ManacherPreprocess(s, n, s1);
// s1 的回文半径 就是 s 的回文长度
return Manacher(s1, n1);
}
算法复杂度
最后,分析 Manacher 算法的时间复杂度。
易知,预处理过程时间复杂度是 $O(n)$ 。
为方便分析算法主流程的时间复杂度,把其代码精简为伪代码如下:
Manacher 算法主流程 - 伪代码
function Manacher
for i < n // 外层循环
if i < r
p[i] = min(p[j], r - i)
else
p[i] = 0
left = i - p[i] - 1
right = i + p[i] + 1
while (s[left] == s[right]) // 内层循环
left--
right++
p[i]++
if right > r
r = right
算法主过程虽然有两层循环,但是内层循环只有在 后两种情况 发生时进入, 也就是只有当以 i
为中心的回文串 q
跨越最右边界 r
的时候才进入,这种情况下最右边界会增大。 导致后面的迭代过程中,第一种情况 就更容易发生。
内层循环的 right
起点是:
这两种情况下,内层循环起点至少 > r
。
内层循环结束后,都会更新 r
变大到新的右边界 right
。
就是说, 本次内层循环的终点和下一次内层循环的起点无缝衔接 。
所以内层循环总的步数是线性的 n
次。
两层循环加起来的总步数就是 2n
次,时间复杂度即 $O(n)$ 。
可以说,Manacher 算法最大化地利用了已知最右回文串的信息,才达到了线性时间复杂度。
结语 ¶
本文解决最长回文子串问题的五种方法中, 最容易理解的思路是中心扩展法。 时间表现最好的是 Manacher 方法。
我个人比较喜欢的则是两个动态规划方法, 毕竟中心扩展法和 Manacher算法 是针对回文串问题的具体算法,动态规划的思想则更具一般性。
(完)
补充说明:
原来本文还介绍了一种错误的方法:
此方法由 @ph 在评论中指出反例:”abc12cba” .
Update: 2023/11/14 加入前缀哈希法。
相关阅读:
本文原始链接地址: https://writings.sh/post/algorithm-longest-palindromic-substring