例1
给定一个长度为N的数组:$A_1,A_2,...,A_N$(N <= 100000,1 <= A[i] <= 100000)。然后有M个询问,每次询问给两个整数L,R,问A[L]~A[R]的和是多少。(M <= 100000)
这道题最直接的做法就是每次询问的时候,用一个循环累加A[L]~A[R]的和,伪代码如下:
Ask(L,R)
Sum = 0
For i = L...R
Sum += A[i]
return Sum
上面这段伪代码,处理一个询问的时间复杂度是O(R-L),考虑到R最大是N,L最小是1,所以可以认为是O(N)。而通过前缀和,我们可以把每次询问的复杂度降到O(1)
思路
假设我们有这么一个数组:$A=[A_1, A_2,...,A_N]$。我们将A[i]加到A[j]的和称为部分和,记作S[i,j],上面的题目就是询问M次部分和。为了减少计算部分和的复杂度,我们先计算出前缀和:S[i] = A[1] + A[2] + ... + A[i]。前缀和可以通过递推的方法O(N)求出来
S[0] = 0
For i = 1...N
S[i] = s[i-1] + A[i]
我们看下图,第一排[1,2,5,4,3]是A数组,第二排[0,1,3,8,12,15]就是前缀和。当我们有了前缀和,想要计算S[i,j] = A[i] + A[i+1] + ... + A[j]的时候,直接用S[j] - S[i-1]就行了,比如我们要算A[2]+A[3]+A[4] = 2+5+4=11,只要算S[4]-S[1]=12-1=11即可
所以我们利用前缀和就可以把计算部分和的复杂度降到O(1),只用计算一次减法。注意A数组是从下标1开始的,但是前缀和数组是从下标0开始的,并且S[0]的值0。这样可以在计算从$A_1$开始的部分和时也不会出问题,例如$A_1+A_2+A_3=S[3]-S[0] = 8-0=8$
例2 K倍区间
思路1 暴力枚举
Ans = 0
For i = 1...N
For j = i...N
Sum = 0
For p = i...j
Sum += A[p]
If Sum % k == 0
Ans++
这个算法的时间复杂度是$O(N^3)$
思路2 前缀和优化
优化的思路就是先把部分和,转换成前缀和的差。题目要求A[i]+A[i+1]+…+A[j]是K的倍数,等价于S[j]-S[i-1]是K的倍数,等价于S[j]与S[i-1]模K余数相等。所以我们可以还是2重循环枚举i和j,但是直接用前缀和判断是不是K的倍数:
Ans = 0
For i = 1...N
For j = i...N
If (S[j] - S[i - 1]) % k == 0
Ans++
优化之后的复杂度是$O(N^2)$,还不足够优秀,还是会超时。我们再进一步分析一下要求的答案和前缀和的关系,看一下下面这张图
图中的第一排[1, 2, 5, 4, 3]是A数组。绿色的第二排是前缀和,天蓝色的第三排是前缀和%K之后的结果,这里我们假设K=2。
我们之前的算法,实际上就是在第三排的数组里,找两个相等的值(这里解释一下为什么是找相等的值,因为如果两个值相等,那么s[j] - s[i-1]=0,0%k=0)。每一对相等的值,都对应着一个K倍区间。比如第三排有3个0,第一个0和第二个0,对应[1, 2, 5]这个区间;第一个和第三个0,对应[1, 2, 5, 4]这个区间;第二个和第三个0,对应[4]这个区间
所以我们已知第三排数组有3个0和3个1的情况下,可以直接用组合数求出来K倍区间的数目:C(3,2)+C(3, 2)=6。其中C(3, 2)是指从3个物品里取出2个来的组合数。因为有3个0和3个1,所以答案就是C(3, 2)+C(3, 2)
把上面统计的思路归纳一下,就是:计算前缀和S[0], S[1], S[2], … S[N]。统计S[]中模K余0, 1, 2 … K-1的数量,记为cnt[0], cnt[1], cnt[2] … cnt[K-1]。最终答案就是:
$$ cnt[0]\times \frac{cnt[0]-1}{2} + cnt[1]\times \frac{cnt[1]-1}{2}+...+cnt[k-1]\times \frac{cnt[k-1]-1}{2} $$
#include <iostream>
#include <unordered_map>
using namespace std;
int n,k,a[100001],s[100001];
unordered_map<int,int> cnt;
//cnt[0]存储的是余数是0的前缀和有几个
//cnt[1]存储的是余数是1的前缀和有几个
//以此类推
int main()
{
cin >> n >> k;
for(int i = 1;i <= n;i++)
cin >> a[i];
s[0] = 0;
cnt[0] = 1;
for(int i = 1;i <= n;i++)
{
s[i] = (s[i-1] + a[i]) % k;
cnt[s[i]]++;
//一边求前缀和
//一边统计前缀和模K的余数出现了多少次
}
long long ans = 0;
//根据每个余数出现的次数用组合数求答案
for(int i = 0;i < k;i++)
ans += (long long)(cnt[i]) * (cnt[i] - 1) / 2;
//把答案累加上C(cnt[i], 2)
//也就是cnt[i]*(cnt[i]-1)/2
cout << ans;
return 0;
}
上面的程序既用到了前缀和优化,也用了哈希表统计每个前缀和余数出现的次数。总复杂度是$O(N+K)$
例3 K的倍数
我们要找到最长的K倍区间。实际上就是找到前缀和余数最左边和最右边的0的位置,算一下长度;再找到最左边和最右边的1的位置,算一下长度……最后找到最左边和最右边K-1的位置,算一下长度。最终取其中最长的区间就是答案
#include <iostream>
#include <unordered_map>
using namespace std;
int n,k,a[100001],s[100001];
unodered_map<int.int>lmost.rmost;
int main()
{
cin >> n;
for(int i = 1;i <= n;i++)
cin >> a[i];
cin >> k;
for(int i = 1;i <= n;i++)
{
lmost[i] = n + 1;
rmost[i] = -1;
}
s[0] = 0;
lmost[0] = rmost[0] = 0;
for(int i = 1;i <= n;i++)
{
//一边计算前缀和
//一边更新余数的最左位置和最右位置
s[i] = (s[i-1] + a[i]) % k;
if(lmost[s[i]] > i)
lmost[s[i]] = i;
if(rmost[s[i]] < i)
rmost[s[i]] = i;
}
int ans = 0;
//根据每个余数出现的次数用组合数求答案
//前缀和都余i的对应的区间长度
for(int i = 0;i < k;i++)
ans = rmost[i] - lmost[i];
cout << ans;
return 0;
}
我们用lmost和rmost保存第一个前缀和余数最左和最右的下标。整个程序复杂度也是$O(n+k)$