线段树的概念与性质
线段树首先是一棵树,而且是二叉树。树上的每个节点对应于一个区间[a,b],a,b通常为整数。同一层的节点所代表的区间,互相不重叠。并且同一层的区间加起来是连续的区间,叶子节点的区间是单位长度1,无法再分
例如下图表示的是区间[1,9]的线段树
从图上可以看出线段树具有下面几个性质:
- 每个区间的长度是区间内整数的个数
- 叶子节点长度为1,不能再分
- 若一个节点对应的区间是[a,b],则其子节点对应的区间分别是[a,(a+b)/2]和[((a+b)/2)+1,b](除法去尾取整)
- 线段树的平分构造实际上是利用二分的方法,若根节点对应的区间是[a,b],那么他的深度为$log_2(b-a+1)+1$(向上取整)
- 叶子节点的数目和根节点表示的区间长度相同
- 线段树节点要么0度,要么2度,因此若叶子节点数目为N,则线段树总节点数目为2N-1
- 线段树上,任意一个区间被分解后得到的“终止节点”数目都是logn量级
- 线段树上更新叶子节点和进行区间分解时间复杂度都是O(logn)的
以上结论为线段树能在O(logn)的时间内完成插入、更新、查找、统计数据提供了理论依据
线段树的构建
伪代码
function 以节点idx为根结点,idx对应区间为[l,r]
对节点idx初始化
if(l != r)
以idx的左孩子为根建树,区间为[l,(l+r)>>1]
以idx的右孩子为根建树,区间为[((l+r)>>1)+1,r]
建树的时间复杂度是O(n),n为根节点对应的区间长度
线段树的基本用途
线段树适用于和区间统计有关的问题。比如某些数据可以按区间进行划分,按区间动态进行修改,而且还需要按区间多次查询,那么使用线段树可以达到较快的速度
线段树应用举例
原题链接:HDU1166
给你一个数列$A_1,A_2,...,A_n$,并且多次进行下列两个操作:
- 对数列里面的某个数进行加减
- 询问这个序列里面任意一个连续的子序列$A_i,A_{i+1},...,A_j$的和是多少
构建一棵线段树,[1,n]就是根节点对应的区间,在每个节点记录该节点对应的区间内的和sum
对于操作1,因为序列里面$A_i$最多只会被线段树的logn个节点覆盖。只要求对线段树覆盖的$A_i$所在节点的区间进行操作,因此时间复杂度是O(logn)
对于操作2,同样只需要找到区间覆盖的“终止”节点,然后把“终止”节点的sum累加起来,因为这些节点的数量是logn的,所以这一步的复杂度也是O(logn)
走到节点[l,r]时,如果要查询的区间就是[l,r],那么直接返回该节点的sum,并累加到总和上;如果不是,则取mid = (l+r) >> 1,然后看要查询的区间与[l,mid]或[mid+1,r]哪个有交集,就进入哪个区间进行进一步查询
用线段树解题,关键是要想清楚每个节点要存哪些信息。先建树,然后插入数据,最后更新、查询
每个节点可表示为一个结构体
class Node {
int l, r, sum;
}
线段树一般可以由左右指针或数组存储,根节点下标为0,假设线段树某节点为i,则:
- 左子节点下标为(i << 1) + 1
- 右子节点下表为(i << 1) + 2
如果根节点区间为[1,n]
- 使用左右节点指针,则数组需要有2n-1个元素
- 不适用左右节点指针,则数组需要有$2*2^{log_2n}-1$个元素。由于该值小于等于4n-1,因此实际运用时常开4n大小的数组即可
构造初始线段树由根节点一次往下递归构造,代码如下
static void make(int l, int r, int idx) { // l为左端点,r为右端点,idx为数组下标
n[idx].l = l;
n[idx].r = r;
if (l == r) //已经是叶节点了
n[idx].sum = t[l]; //也可以是t[r]
else {
make(l,(l + r) >> 1,(idx << 1) + 1); //递归构造左子树
make(((l + r) >> 1) + 1, r, (idx << 1) + 2); //递归构造右子树
n[idx].sum = n[(idx << 1) + 1].sum + n[(idx << 1) + 2].sum;
//父节点值等于子节点值之和,线段树分成两段
}
}
t数组存放输入的初始值。当总数为n时,执行make(1,n,0),输入样例得到的额线段树如下图所示
当第idx个营地增加j个人时,从根节点n[0]开始,不断往下递归更改人数,即只要包含改点idx的线段都增加相应的人数j,代码如下
static void add(int i, int j, int idx) { // 第i个营地增加j个人
// 从根节点不断往下更改,只要包含点i的线段都增加数量j
n[idx].sum += j;
if (n[idx].l == i && n[idx].r == i) // 如果找到i的叶子节点则停止
return;
if (i <= ((n[idx].l + n[idx].r) >> 1)) // 如果i在线段左边
add(i, j, (idx << 1) + 1); // 递归进入左子节点
else // 如果i在线段右边
add(i, j, (idx << 1) + 2); // 递归进入右子节点
}
同理,当第i个营地减少j个人时,代码如下
static void sub(int i, int j, int idx) { // 第i个营地减少j个人
// 从根节点不断往下更改,只要包含点i的线段都减少数量j
n[idx].sum -= j;
if (n[idx].l == i && n[idx].r == i) // 如果找到i的叶子节点则停止
return;
if (i <= ((n[idx].l + n[idx].r) >> 1)) //如果i在线段左边
sub(i, j, (idx << 1) + 1); // 递归进入左子节点
else
sub(i, j, (idx << 1) + 2); // 递归进入右子节点
}
询问从[l,r]区间内的营地人数代码如下
static void query(int l, int r, int idx) { // 初始idx为0,即从根节点开始查找
if (l <= n[idx].l && r >= n[idx].r)
SUM += n[idx].sum;
else {
int mid = (n[idx].l + n[idx].r) >> 1;
if (r <= mid) // 要查询的区间在左边
query(l, r, (idx << 1) + 1);
else if (l > mid) // 要查询的区间在右边
query(l, r, (idx << 1) + 2);
else { // 要查询的区间在中间,分段查询,左右都查
query(l, r, (idx << 1) + 1);
query(l, r, (idx << 1) + 2);
}
}
}
这段代码可以这么理解,假设要查询的区间为[l,r],当前走到的节点对应的区间是[n[idx].l,n[idx].r],如果$[n[idx].l,n[idx].r]\in [l,r]$,则将当前区间的信息记录下来,例如求区间和,就将当前区间和的信息累加到SUM中;如果要查询区间的右端点r<=当前区间的中点,说明需要查询的区间就在左子树里;反之,如果要查询区间的左端点l>当前区间的终点,说明要查询的区间就在右子树里;如果上面两种情况都不满足,说明左右子树均有需要的信息,左右子树都要查
完整代码如下
import java.util.Scanner;
public class Main {
static Node[] n;
static int[] t;
static int SUM;
public static void main(String[] args) {
Scanner cin = new Scanner(System.in);
int T = cin.nextInt();
for (int p = 1; p <= T; p++) {
int tmp = 0;
int N = cin.nextInt();
n = new Node[4 * N];
t = new int[N + 1];
for (int i = 1; i <= N; i++)
t[i] = cin.nextInt();
make(1, N, 0);
while (true) {
String str = cin.next();
if ("End".equals(str))
break;
int i = cin.nextInt();
int j = cin.nextInt();
if ("Query".equals(str)) {
SUM = 0;
if (tmp == 0) {
System.out.println("Case " + p + ":");
tmp++;
}
query(i, j, 0);
System.out.println(SUM);
} else if ("Add".equals(str))
add(i, j, 0);
else // Sub
sub(i, j, 0);
}
}
}
static void make(int l, int r, int idx) { // l为左端点,r为右端点,idx为数组下标
n[idx] = new Node();
n[idx].l = l;
n[idx].r = r;
if (l == r) // 已经是叶节点了
n[idx].sum = t[l]; // 也可以是t[r]
else {
make(l, (l + r) >> 1, (idx << 1) + 1); // 递归构造左子树
make(((l + r) >> 1) + 1, r, (idx << 1) + 2); // 递归构造右子树
n[idx].sum = n[(idx << 1) + 1].sum + n[(idx << 1) + 2].sum;
// 父节点值等于子节点值之和,线段树分成两段
}
}
static void add(int i, int j, int idx) { // 第i个营地增加j个人
// 从根节点不断往下更改,只要包含点i的线段都增加数量j
n[idx].sum += j;
if (n[idx].l == i && n[idx].r == i) // 如果找到i的叶子节点则停止
return;
if (i <= ((n[idx].l + n[idx].r) >> 1)) // 如果i在线段左边
add(i, j, (idx << 1) + 1); // 递归进入左子节点
else // 如果i在线段右边
add(i, j, (idx << 1) + 2); // 递归进入右子节点
}
static void sub(int i, int j, int idx) { // 第i个营地减少j个人
// 从根节点不断往下更改,只要包含点i的线段都减少数量j
n[idx].sum -= j;
if (n[idx].l == i && n[idx].r == i) // 如果找到i的叶子节点则停止
return;
if (i <= ((n[idx].l + n[idx].r) >> 1)) // 如果i在线段左边
sub(i, j, (idx << 1) + 1); // 递归进入左子节点
else
sub(i, j, (idx << 1) + 2); // 递归进入右子节点
}
static void query(int l, int r, int idx) { // 初始idx为0,即从根节点开始查找
if (l <= n[idx].l && r >= n[idx].r)
SUM += n[idx].sum;
else {
int mid = (n[idx].l + n[idx].r) >> 1;
if (r <= mid) // 要查询的区间在左边
query(l, r, (idx << 1) + 1);
else if (l > mid) // 要查询的区间在右边
query(l, r, (idx << 1) + 2);
else { // 要查询的区间在中间,分段查询,左右都查
query(l, r, (idx << 1) + 1);
query(l, r, (idx << 1) + 2);
}
}
}
}
class Node {
int l, r, sum;
}
关于线段树的更多习题见线段树例题
单点更新
HDU 1166 敌兵布阵
HDU 1754 I Hate It
POJ 3264 Balanced Lineup
HDU 1394 Minimum Inversion Number
HDU 2795 Billboard
POJ 2352 Stars
POJ 2481 Cows
POJ 3067 Japan
CF 6E Exposition
区间更新
HDU 1698 Just a Hook
HDU 1556 Color the ball
ZOJ 1610 Count the Colors
POJ 2528 Mayor's posters
Ural 1019 A Line Painting
[...]在开始之前先说明一下:我的代码风格和网上很多都不大一样,网上很多线段树都采用数组来模拟,但是空间消耗很大,需要提前开4倍的空间,洛谷上有人说有的题需要开8倍的空间才能过。所以我采用结构体指针加动态开点的方式写线段树(调了两天。。。)如果觉得我的代码不太好理解,推荐阅读这个。[...]
-a 和 +(-a) 有区别吗?
代码能c风格吗@(乖)@(乖)@(乖)