SPOJ SUBST1 POJ 2406 POJ REPEATS 后缀数组小结

//聪神说:做完了题目记得总结,方便以后复习。

SPOJ SUBST1

题目链接:点击打开链接

题意:给一个字符串,求不同子串个数。

思路:假设所有子串都不同,答案为len*(len+1)/2;然而不是这样... 下面我们就找出重复的子串:

首先先将后缀排序,对于后缀i能生成len-sa[i]个子串,这其中有height[i]个子串与第i-1个后缀生成的子串重复了;

所以答案为 len*(len+1)/2-segema(height[i]) 。

cpp代码:

//spoj disubstr
#include <cstring>
#include <iostream>
#include <cstdio>
#include <vector>
using namespace std;

const int MAXN =1010;
int t1[MAXN],t2[MAXN],c[MAXN];

bool cmp(int *r ,int a,int b ,int l){
	return r[a]==r[b]&&r[a+1]==r[b+1];
}
void da(int sa[],int Rank[],int str[],int height[],int n,int m){
	n++;
	int i,j,p,*x=t1,*y=t2;
	for(i=0;i<m;i++) c[i]=0;
	for(i=0;i<n;i++)c[x[i]=str[i]]++;
	for(i=1;i<m;i++)c[i]+=c[i-1];
	for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
	for(j=1;j<=n;j<<=1){
		p=0;
		for(i=n-j;i<n;i++)y[p++]=i;
		for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
		for(i=0;i<m;i++)c[i]=0;
		for(i=0;i<n;i++)c[x[y[i]]]++;
		for(i=1;i<m;i++)c[i]+=c[i-1];
		for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
		swap(x,y);
		p=1;x[sa[0]]=0;
		for(i=1;i<n;i++){
			            x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
		//	x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
		}
		if(p>=n) break;
		m=p;
	}

	int k=0;
	n--;
	for(i=0;i<=n;i++ )Rank[sa[i]]=i;
	for(i=0;i<n;i++){
		if(k)k--;
		j=sa[Rank[i]-1];
		while(str[i+k]==str[j+k])k++;
		height[Rank[i]]=k;
	}
}

char st[MAXN];
int Rank[MAXN],str[MAXN],sa[MAXN],height[MAXN];
int main(){
	//freopen("data.in","r",stdin);
	int T;

	scanf("%d",&T);
	while(T--){
		scanf("%s",st);
		int l=strlen(st);
		for(int i=0;i<=l;i++){
			str[i]=st[i];
		}
		da(sa,Rank,str,height,l,128);
		long long ans=(long long)(l+1)*(l)/2;
		for(int i=2;i<=l;i++){
			ans-=height[i];
		}
		cout<<ans<<endl;
	}

	return 0;

}

POJ 2406:

题意:给定字符串,问最多能找出几个循环节。

思路:寻找最大的k使得 lcp(0,k)=k 并且 lcp(0,k)%k==0;

但是我是用kmp写的。。。 next[n] 即为 将字符串反转之后lcp(0,len-(next[n]))==next[n]最大值。 

cpp:

#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
const int MAXN =2000000;

int Next[MAXN];
char str[MAXN];

void get_Next(int len){
	int i=0,j=-1;
	Next[i]=j;
	while(i<len){
		if(str[i]==str[j]||j==-1){
			++i,++j;
			Next[i]=j;
		}
		else {
			j=Next[j];
		}
	}
}
int main(){
	freopen("data.in","r",stdin);
	while(~scanf("%s",str)){

	//	cout<<str<<endl;
		if(str[0]=='.') break;
		int len=strlen(str);
		get_Next(len);
		if(len%(len-Next[len])==0)
		printf("%d\n",len/(len-Next[len]));
		else puts("1");
	}
	return 0;
}

SPOJ REPEATS

题意:寻找循环次数最多的循环序列,输出循环次数。

思路:

cpp:

#include <cstring>
#include <iostream>
#include <cstdio>
#include <vector>
using namespace std;

const int MAXN =200010;
int t1[MAXN],t2[MAXN],c[MAXN];
int str[MAXN],sa[MAXN],Rank[MAXN],height[MAXN];
bool cmp(int *r ,int a,int b ,int l){
	return r[a]==r[b]&&r[a+1]==r[b+1];
}
void da(int n,int m){
	n++;
	int i,j,p,*x=t1,*y=t2;
	for(i=0;i<m;i++) c[i]=0;
	for(i=0;i<n;i++)c[x[i]=str[i]]++;
	for(i=1;i<m;i++)c[i]+=c[i-1];
	for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
	for(j=1;j<=n;j<<=1){
		p=0;
		for(i=n-j;i<n;i++)y[p++]=i;
		for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
		for(i=0;i<m;i++)c[i]=0;
		for(i=0;i<n;i++)c[x[y[i]]]++;
		for(i=1;i<m;i++)c[i]+=c[i-1];
		for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
		swap(x,y);
		p=1;x[sa[0]]=0;
		for(i=1;i<n;i++){
			x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
			//x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
		}
		if(p>=n) break;
		m=p;
	}
	int k=0;
	n--;
	for(i=0;i<=n;i++ )Rank[sa[i]]=i;
	for(i=0;i<n;i++){
		if(k)k--;
		j=sa[Rank[i]-1];
		while(str[i+k]==str[j+k])k++;
		height[Rank[i]]=k;
	}
}

int mm[MAXN];
int best[20][MAXN];
void initRMQ(int n){
	mm[0]=-1;
	for(int i=1;i<=n;i++)
		mm[i]=((i&(i-1))==0?mm[i-1]+1:mm[i-1]);
	for(int i=1;i<=n;i++) best[0][i]=i;
	for(int i=1;i<=mm[n];i++){
		for(int j=1;j+(1<<i)-1<=n;j++){
			int a=best[i-1][j];
			int b=best[i-1][j+(1<<(i-1))];
			if(height[a]<height[b])best[i][j]=a;
			else best[i][j]=b;
		}
	}
}
int askRMQ(int a,int b){
	int t;
	t=mm[b-a+1];
	b-=(1<<t)-1;
	a=best[t][a];
	b=best[t][b];
	return height[a]<height[b]?a:b;
}
int lcp(int a,int b){
	a=Rank[a];
	b=Rank[b];
	if(a>b) swap(a,b);
	return height[askRMQ(a+1,b)];
}

char tp[2];
int main(){
	int T,n;
	//freopen("data.in","r",stdin);
	scanf("%d",&T);
	while(T--){
		scanf("%d",&n);
		for(int i=0;i<n;i++){
			scanf("%s",tp);
			str[i]=tp[0];
		}
		int ans=1;
		str[n]=0;
		da(n,128);
		initRMQ(n);
		for(int i=1;i<n;i++){
			for(int j=0;j+i<n;j+=i){
				int k=lcp(j,j+i);
				int tp=j-(i-k%i);
				int ttt=k/i+1;
				if(tp>=0&&lcp(tp,tp+i)>=i){
					ttt++;
				}
				ans=max(ttt,ans);
			}
		}
		cout<<ans<<endl;
	}
	return 0;

}

时间: 05-05

SPOJ SUBST1 POJ 2406 POJ REPEATS 后缀数组小结的相关文章

poj 2406 Power Strings 后缀数组解法

连续重复子串问题 poj 2406 Power Strings http://poj.org/problem?id=2406 问一个串能否写成a^n次方这种形式. 虽然这题用kmp做比较合适,但是我们还是用后缀数组做一做,巩固后缀数组的能力. 对于一个串,如果能写出a^n这种形式,我们可以暴力枚举循环节长度L,那么后缀suffix(1)和suffix(1 + L)的LCP应该就是 lenstr - L.如果能满足,那就是,不能,就不是. 这题的话da算法还是超时,等我学了DC3再写上来. 其实这

POJ 2406 Power String 后缀数组

这题曾经用KMP做过,用KMP 做非常的简单,h函数自带的找循环节功能. 用后缀数组的话,首先枚举循环节长度k,然后比较LCP(suffix(k + 1), suffix(0)) 是否等于len - k, 如果相等显然k就是一个循环节. 得到LCP的话可以通过预处理出所有点和0的lcp就好了.另外倍增法构造后缀数组还有用RMQ来搞lcp nlogn是不行的,会超时,所以可以dc3走起了.. #include <cstdio> #include <cstring> #include

POJ 3294 Life Forms (后缀数组)

题目大意: 求出在m个串中出现过大于m/2次的子串. 思路分析: 如果你只是直接跑一次后缀数组,然后二分答案扫描的话. 那么就试一下下面这个数据. 2 abcdabcdefgh efgh 这个数据应该输出 efgh 问题就在于对于每一个串,都只能参与一次计数,所以在check的时候加一个标记数组是正解. #include <cstdio> #include <iostream> #include <algorithm> #include <cstring>

POJ 3882 Stammering Aliens 后缀数组height应用

题目来源:POJ 3882 Stammering Aliens 题意:给你m一个一个字符串 求至少出现m次的最长字符串 可以在字符串中重叠出现 思路:二分长度l 然后从height数组中找长度大于等于l的前缀 #include <cstdio> #include <cstring> #include <algorithm> using namespace std; const int maxn = 40010; char s[maxn]; int sa[maxn]; i

poj 3261 Milk Patterns 后缀数组+二分

1 /*********************************************************** 2 题目: Milk Patterns(poj 3261) 3 链接: http://poj.org/problem?id=3261 4 题意: 给一串数字,求这些数字中公共子串个数大于k的 5 最长串. 6 算法: 后缀数组+二分 7 ***********************************************************/ 8 #incl

POJ 1743 Musical Theme 后缀数组 最长重复不相交子串

Musical ThemeTime Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://poj.org/problem?id=1743 Description A musical melody is represented as a sequence of N (1<=N<=20000)notes that are integers in the range 1..88, each representing a key on the piano. It

poj 3581 Sequence(后缀数组,离散化)详解

题目链接:http://poj.org/problem?id=3581 题目大意:给一个数列,要求将其分成三段,每段进行翻转后形成后合并成新数列,求按字典顺序最小的新数列. 思路: 注意到题目中数列a0,a2,a3...an-1, a0是最大的,因此将原数列翻转后an-1,an-2,...,a1,a0,求后缀数组, sa[0]所代表的后缀即为所求第一段翻转后的数列,注意到要分成三份,因此sa[0]<2时不可取,此时找sa[1], sa[2]看是否可取.找第一个位置后,设剩下 数列是an-1,an

Poj 3294 Life Forms (后缀数组 + 二分 + Hash)

题目链接: Poj 3294 Life Forms 题目描述: 有n个文本串,问在一半以上的文本串出现过的最长连续子串? 解题思路: 可以把文本串用没有出现过的不同字符连起来,然后求新文本串的height.然后二分答案串的长度K,根据K把新文本串的后缀串分块,统计每块中的原文本串出现的次数,大于原文本串数目的一半就作为答案记录下来,对于输出字典序,height就是排好序的后缀数组,只要按照顺序输出即可. 1 #include <cstdio> 2 #include <cstring>

SPOJ REPEATS 后缀数组

题目链接:http://www.spoj.com/problems/REPEATS/en/ 题意:首先定义了一个字符串的重复度.即一个字符串由一个子串重复k次构成.那么最大的k即是该字符串的重复度.现在给定一个长度为n的字符串,求最大重复次数. 思路:根据<<后缀数组——处理字符串的有力工具>>的思路,先穷举长度L,然后求长度为L 的子串最多能连续出现几次.首先连续出现1 次是肯定可以的,所以这里只考虑至少2 次的情况.假设在原字符串中连续出现2 次,记这个子字符串为S,那么S 肯