1. 引言
前文使用倍增算法实现了快速求幂的运算,本文继续讲解ST
表,ST
表即倍增表,本质就是动态规划表,记忆化了不同子问题域中的结果,用于实时查询。只是动态规划过程和传统的稍有点不一样,采用了倍增思想。ST
表往往用于存储子区间信息,如某区间的最值……
是不是所有的区间问题都可以使用ST
表?
某个区间查询问题是否适用ST
表,在于其进行的操作是否允许区间重叠。如下图所示:
如求 [1,6]
区间的最大值,可以使用如下 2
种方案:
- 直接在
[1,6]
子区间内使用求最值算法,找出最值。这个算法较易实现,一个循坏语句就搞定。
- 如果已经知道了区间
[1,5]
和区间[3,6]
的最大值,这两个区间可认为是区间[1,6]
的子区间,且两者有重叠部分,如图可知区间[1,6]
最大值是两个子区间中的较大值,即为10
。类似于这样的区间关系,是可以使用ST
表实现的。
为什么称ST
表为倍增表?
整个数组是一个区间,则分割成小区间的方案可以是:
- 长度为
1
的区间:[0,0],[1,1],[2,2]……
- 长度为
2
的区间:[0,1],[1,2],[2,3]……
- 长度为
3
的区间:[0,2],[1,3],[2,4]……
- 长度为
4
的区间:[0,3],[1,4],[2,5]……
- 长度为
5
的区间……
还可以划分出长度为6、7、8……
的区间,如此分肯定是可行的,但是显得过于零碎、过多,维护代价较高。倍增法分割的原则是按长度为 1、2、4、8、16……
分割,也就是按 2
的幂次方分割,这便是倍增表的由来。
- 长度为
1
的区间:[0,0],[1,1],[2,2]……
- 长度为
2
的区间:[0,1],[1,2],[2,3]……
- 长度为
4
的区间:[0,3],[1,4],[2,5]……
- 长度为
8
的区间:[0,7],[1,8],[2,9]……
为什么说这种方案是可行的?
根据前面的分析可知,如果知道当前区间的子区间的最大值且子区间之间连续或重叠的,则当前区间的值可由子区间推导出来。从倍数关系来看,长度为 8
的区间可分割成 2
个长度为 4
的区间,长度为 4
的区间可分割成 2
个长度为 2
的区间……
如下图所示,任何一个区间都可以分割成两个与之有关联的子区间,从而减少更多细碎区间的存在。
2. 生成 ST 表
区间应该有 3
个属性,左端点(left)
、右端点(right)
、此区间的最大值。以下分别分析长度不同时区间的左端与右端的关系。
先以长度为 8
的区间[0,7]
为例探讨左端与右端的关系:
left=0,right=left+2
3-1=0+8-1=7
。
以长度为 4
的区间[4,7]
为例探讨左端与右端的关系:
left=4,right=left+2
2-1=4+4-1=7
。
以长度为 2
的区间[4,5]
为例探讨左端与右端的关系:
left=4,right=left+2
1-1=4+2-1=5
。
以长度为 1
的区间[4,4]
为例探讨左端与右端的关系:
left=4,right=left+0
1-1=4+1-1=4
。
再观察求幂运算中指数的通用性:区间长度为 1
时指数为 0
;区间长度为 2
时指数为 1
;区间长度为 4
时指数为 2
;区间长度为 8
时指数为 3
……也就是如果知道了left
以及区间长度则可计算出右区间的大小,右区间是动态值。
对于长度为 10
的数列而言,到底能划分成多少个不等的区间?
从上述例子来看,数组长度为 10
时,区间最大长度为 8
也就是 23 就可以了,其值是 log10(以 2 为底数)
向下取整。有了上述推导的支撑,如可创建 ST
就应该呼之欲出了。
创建一个二维数组,命名为 ST
表。行坐标表示左端,列坐标并不直接表示右端,而是表示指数,有了指数信息即可以表示区间长度,又能计算出右端大小。如下图 st[0][0]
表示的left=0、right=left+2
0-1=0
,即区间[0,0]
。
数组存储对应区间的最大值,根据上述的推论可知,区间长度为1
的最大值为自己。
当 right=1
即表示长度为 2
的区间,此时,如下图 st[0][1]
的值应该如何推导出来。
回到上文中的推导理论,知道区间长度为 2
的最大值,可以是它的 2
个长度为 1
的子区间的中的最大值。如下图所示,区间[0,1]
的最大值是 max([0,0],[1,1] )
的最大值,即为 8
。
问题是如何写出动态转移公式?
再分析一下:
- 求指数为
1
的区间值,得从指数为0
的区间找,首先,指数要降级。 - 左边子区间
[0,0]
的left
值和区间[0,1]
的左值相同,右边子区间[1,1]
的左端值是左子区间的left+2
0=0+1=1
。
如此,动态转移公式也就可以出来了:
- 当
right=0
时,st[left][right]=nums[left]
。 - 当
right!=0
时,st[left][right]=max(st[left][right-1],st[left+2
right-1][right-1]
。
编码实现:
#include<iostream>
#include<cmath>
#include<algorithm>
using namespace std;
//st 表
int st[100][10];
//原数组
int nums[100];
//实际长度
int n,col;
/*
* 初始化
*/
void init() {for(int i=0; i<n; i++) {scanf("%d",&nums[i]);st[i][0]=nums[i];}
}
/*
* 创建 ST 表
*/
void setSt() {col =(int)(log(n)/log(2));for(int j=1; j<=col; j++)for (int i=0; i<n-(1<<j)+1; i++)st[i][j]=max(st[i][j-1],st[i+(1<<(j-1))][j-1]);
}
/*
*输出ST表
*/
void show() {for(int i=0; i<n; i++) {for(int j=0; j<=col; j++) {cout<<st[i][j]<<"\t";}cout<<endl;}
}
int main() {scanf("%d",&n);init();setSt();show();return 0;
}
3. 查询
st
表的创建,目的是快速查询某区间的最大值,下面讨论如何准确定位区间,以及找到最大值。
如下图所示,如果用户输入的区间是[0,3]
,则运气很好,因为恰好有这么一个区间。那么如何得到 st[i][j]
中 i和j
的值?
显然i=0
,求 j
的表达式为:i+2
j-1=3
,则 2
j=4-0=4;j=log4(以 2 为底); j=2
,也就直接从 st[0][2]
得到最大值。
但是,如果输入的区间是[0,6]
,不存在这么一个区间,则需要从能作为此区间的子区间中查找。
假设在st[i][j]
中,i=l,j=p,len=r-l+1(区间长度)
,找最大的p
应满足2
p <= len
(以l
为起点的st
表数据覆盖[l,r]
中数足够多),则p=int(log(len)/log(2))
。
左子区间为 st[l][p]
,右子区间为 st[x][r]
。如何求x
,对于st[x][r]
,应有:[x][x+pow(2,p)-1]<=>[x][r]
。所以, x+pow(2,p)-1=r
,移项,得:x=r+1-pow(2,p)
,显然,x>=l ( l+pow(2,p)-1<=r,x+pow(2,p)-1=r,故x>=l)
综上[l,r]
的最大值 = max( f[l][p] , f[x][R] )
。
完整代码:
#include<iostream>
#include<cmath>
#include<algorithm>
using namespace std;
//st 表
int st[100][10];
//原数组
int nums[100];
//实际长度
int n,m,col;
/*
* 初始化
*/
void init() {for(int i=0; i<n; i++) {scanf("%d",&nums[i]);st[i][0]=nums[i];}
}
/*
* 创建 ST 表
*/
void setSt() {double a= log(5);cout<<a<<endl;col =(int)(log(n)/log(2));for(int j=1; j<=col; j++)for (int i=0; i<n-(1<<j)+1; i++)st[i][j]=max(st[i][j-1],st[i+(1<<(j-1))][j-1]);
}
/*
*输出ST表
*/
void show() {for(int i=0; i<n; i++) {for(int j=0; j<=col; j++) {cout<<st[i][j]<<"\t";}cout<<endl;}
}
int find() {int l,r,p,x;for(int i=1; i<=m; i++) {scanf("%d%d",&l,&r);p=(int)(log(r-l+1)/log(2));x=r-(1<<p)+1;int res= max( st[l][p], st[x][p]);cout<<res<<endl;}
}
int main() {scanf("%d%d",&n,&m);init();setSt();show();find();return 0;
}
测试结果:
4. 总结
区间查询有很多方式,ST
是不错的选择。