AC自动机

AC自动机

AC自动机有一个很出色的功能:实现多模式匹配。

多模式匹配:模式串有多个,主串只有一个,要进行多次模式串匹配。如果用KMP就要一个一个模式串进行匹配,效率低。AC自动机就可以做到,只要经过一些预处理之后,扫描一遍主串,就可以找出所有模式串。

fail指针含义:若fail[i]=j,则word[j]word[i]的最长后缀。
fail指针的目的和意义:通过fail指针,把以s[i]为结尾的所有后缀的个数加起来,从而把匹配的模式串加起来。
如何构建fail指针:bfs层次遍历构建。
这个AC自动机感觉也可以 查后缀(想想fail指针的含义)

在这里插入图片描述

数据结构:

int n; //模式串个数
string s; //模式串
string text; //文本串
int trie[1000006][30],cnt[1000006],idx,fail[1000006]; //重要数据结构

先将输入的模式串构建成一棵字典树

void insert(string s)
{int p=0;for(int i=0;s[i];++i){int c=s[i]-'a';if(!trie[p][c]) trie[p][c]=++idx;p=trie[p][c];}cnt[p]++;
}

再设置各个节点的fail指针:bfs(层次遍历)

void getfail()
{queue<int> q;for(int i=0;i<26;++i){if(trie[0][i])q.push(trie[0][i]);fail[trie[0][i]]=0;}while(q.size()){int now=q.front();q.pop();for(int i=0;i<26;++i){if(trie[now][i]){fail[trie[now][i]]=trie[fail[now]][i];q.push(trie[now][i]);}elsetrie[now][i]=trie[fail[now]][i];}}
}

遍历文本串,查询出有多少个匹配的模式串:

int query(string s)
{int now=0,ans=0;for(int i=0;s[i];++i){now=trie[now][s[i]-'a'];for(int j=now;j&&cnt[j]!=-1;j=fail[j]){ans+=cnt[j];cnt[j]=-1;}}return ans;
}

分享B站学习链接:

1.[算法]轻松掌握ac自动机_哔哩哔哩_bilibili

刷题练手链接:

P3808 【模板】AC 自动机(简单版) - 洛谷 | 计算机科学教育新生态 (luogu.com.cn)

参考代码:

#include <bits/stdc++.h>
using namespace std;int n;
string s;
string text;
int trie[1000006][30],cnt[1000006],idx,fail[1000006];
//vector<int> v[N]; //可以存编号为i的结点存放了字符串长度为多少的串 void insert(string s)
{int p=0;for(int i=0;s[i];++i){int c=s[i]-'a';if(!trie[p][c]) trie[p][c]=++idx;p=trie[p][c];}cnt[p]++;
}void getfail()
{queue<int> q;for(int i=0;i<26;++i){if(trie[0][i])q.push(trie[0][i]);fail[trie[0][i]]=0;}while(q.size()){int now=q.front();q.pop();for(int i=0;i<26;++i){if(trie[now][i]){fail[trie[now][i]]=trie[fail[now]][i];q.push(trie[now][i]);}elsetrie[now][i]=trie[fail[now]][i]; //在构建fail指针时,trie在改变,它记录着 在上层 最近的 哪里 会有i这个元素 }}
}int query(string s)
{int now=0,ans=0;for(int i=0;s[i];++i){
//		cout<<i<<' '<<s[i]<<' '<<now<<' '<<trie[now][s[i]-'a']<<endl;now=trie[now][s[i]-'a'];for(int j=now;j&&cnt[j]!=-1;j=fail[j]){
//			cout<<j<<' '<<fail[j]<<endl; ans+=cnt[j];cnt[j]=-1; //这个模板有个问题:只能做一次询问。}}return ans;
}int main()
{cin >> n;while(n--){cin >> s;insert(s);}cin >> text;getfail();cout << query(text) << endl;return 0;
}

模板注意点:
1.插入的字符可以是什么?一般是’a’-'z’共26种.但也有题目会说是 可见字符,可见字符 应该算95个,从32-126
2.如果有多个主串,要注意加一个bool flag[N]处理一下。

裸题:HDU-2222 Keywords Search

2017 ICPC 青岛网络赛 C-The Dominator of Strings
题意:多组样例,每次给出N个字符串,求出N个串的母串。
代码:一般参考以下模板!

#include <bits/stdc++.h>
using namespace std;#define fi first
#define se second
int T,n,len;
string s,text;
int trie[100006][26],idx,fail[100006],cnt[100006];void Init() {for(int i=0;i<=idx;i++){cnt[i]=0;
//        fail[i]=0;  for(int j=0;j<26;j++)trie[i][j]=0;}idx=0;
}inline void insert(string s){int p=0;for(int i=0;s[i];++i){int c=s[i]-'a';if(!trie[p][c]) trie[p][c]=++idx;p=trie[p][c];}cnt[p]++;
}/*
感觉以下做法:"有一个位置匹配了,就往后配" 这种做法 比较暴力
但有些题 竟然 跑得更快   很奇怪很奇怪很奇怪。。。 
*/ 
int query(string s){int ans=0;for(int i=0;s[i];++i){int c=s[i]-'a';int u=0;int j=0;while(trie[u][c]){if(cnt[trie[u][c]]){ans+=cnt[trie[u][c]];cnt[trie[u][c]]=0;}u=trie[u][c];j++;if(i+j>=s.size()) break; //注意加这一行!不然有些时候会寄! c=s[i+j]-'a';}}return ans;
}/*
正常的AC自动机 模板 
*/
//void getfail(){
//	queue<int> q;
//	for(int i=0;i<26;++i) {
//		if(trie[0][i]) q.push(trie[0][i]);
//		fail[trie[0][i]]=0;
//	}
//	while(q.size()){
//		int now=q.front();
//		q.pop();
//		for(int i=0;i<26;++i){
//			if(trie[now][i]){
//				fail[trie[now][i]]=trie[fail[now]][i];
//				q.push(trie[now][i]);
//			}else{
//				trie[now][i]=trie[fail[now]][i];
//			}
//		}
//	}
//}
//
//int query(string &s){
//	int now=0,ans=0;
//	for(int i=0;s[i];++i){
//		now=trie[now][s[i]-'a'];
//		for(int j=now;j&&cnt[j]!=-1;j=fail[j]){
//			ans+=cnt[j];
//			cnt[j]=-1;
//		}
//	}
//	return ans;
//}int main(){ios::sync_with_stdio(0);cin.tie(0);cout.tie(0);cin>>T;while(T--){cin>>n;Init(); //学习! len=0;for(int i=1;i<=n;++i) {cin>>s;insert(s);if(s.size()>len) text=s,len=s.size();}
//		getfail();if(query(text)==n) cout<<text<<'\n';else cout<<"No\n";}
}

例题:HDU - 2896 病毒侵袭
参考代码:
这道题 字符是可见字符,有多个主串

#include <bits/stdc++.h>
using namespace std;int n,m;
string s,text;
vector<int> v;
int tot;const int N=1e6+5;
int trie[N][100],cnt[N],idx,fail[N];
bool flag[N]; //标记 void insert(string s,int id){int p=0;for(int i=0;s[i];++i){int c=s[i]-32;if(!trie[p][c]) trie[p][c]=++idx;p=trie[p][c];}cnt[p]=id;
}void getfail(){queue<int> q;for(int i=0;i<95;++i){if(trie[0][i])q.push(trie[0][i]);fail[trie[0][i]]=0;}while(q.size()) {int now=q.front();q.pop();for(int i=0;i<95;++i){if(trie[now][i]){fail[trie[now][i]]=trie[fail[now]][i];q.push(trie[now][i]);}else trie[now][i]=trie[fail[now]][i];}}
}void query(string s){int now=0;for(int i=0;s[i];++i){now=trie[now][s[i]-32];for(int j=now;j&&cnt[j]!=-1;j=fail[j]){if(cnt[j] && flag[j]) v.push_back(cnt[j]);flag[j]=0; //这个有个问题:只能查询一次 }}
}int main(){ios::sync_with_stdio(0);cin.tie(0);cout.tie(0);cin>>n;for(int i=1;i<=n;++i){cin>>s;insert(s,i);}getfail();cin>>m;for(int i=1;i<=m;++i){cin>>text;v.clear();for(int i=0;i<=idx;++i) if(cnt[i]) flag[i]=1; //为了实现多次扫描主串 query(text);if(v.size()){sort(v.begin(),v.end());tot++;cout<<"web "<<i<<":";for(auto x:v) cout<<' '<<x;cout<<'\n';}}cout<<"total: "<<tot<<'\n';
}

HDU - 3065 病毒侵袭持续中
这道题 主串有多个子串会跟模式串匹配要算多次
怎么办?答:去掉cnt[j]=-1 以及 条件的 cnt[i]!=-1
这样,主串出现多个模式串,就能算多次了 。
参考代码:

#include <bits/stdc++.h>
using namespace std;int n;#define pii pair<int,int>
#define fi first
#define se second
#define ms(a,x) memset(a,x,sizeof a)
//数据结构
const int N=5e4+10; //应该是模式串总长 
string s[1003],text;
int trie[N][100],cnt[N],idx,fail[N];
vector<pii> v;
unordered_map<int,int> mp; void insert(string s,int k){int p=0;for(int i=0;s[i];++i){int c=s[i]-'A';if(!trie[p][c]) trie[p][c]=++idx;p=trie[p][c]; }cnt[p]=k;
}void getfail(){queue<int> q;for(int i=0;i<26;++i){if(trie[0][i])q.push(trie[0][i]);fail[trie[0][i]]=0;}while(q.size()){int now=q.front();q.pop();for(int i=0;i<26;++i){if(trie[now][i]){fail[trie[now][i]]=trie[fail[now]][i];q.push(trie[now][i]);}else trie[now][i]=trie[fail[now]][i];}}
}void query(string s){int now=0;for(int i=0;s[i];++i){if(s[i]>'Z' || s[i]<'A') {now=0;continue;}now=trie[now][s[i]-'A'];for(int j=now;j;j=fail[j]){if(cnt[j]) mp[cnt[j]]++;}}
}bool cmp(pii x,pii y){return x.fi<y.fi;
}int main(){ios::sync_with_stdio(0);cin.tie(0);cout.tie(0);while(cin>>n){ms(trie,0);ms(cnt,0);ms(fail,0);idx=0;v.clear();mp.clear();for(int i=1;i<=n;++i){cin>>s[i];insert(s[i],i);}getfail();cin>>text;query(text);for(auto x:mp) v.push_back(x); sort(v.begin(),v.end(),cmp);for(auto x:v){cout<<s[x.fi]<<": "<<x.se<<'\n';}}
} 
由若干模式串构建串

HDU - 2825 Wireless Password
题意:给你M个模式串,问有多少种方案 构造长度为N的 至少包含K个模式串的 串。
注意:
1.字符串会包含,如有模式串she he,串she包含由模式串she和he
有一点 串包含 的意思在里面,所以可以想到用AC自动机把模式串全部扔进去。
2.然后用状压dp进行转移

参考

代码:

#include <bits/stdc++.h>
using namespace std;const int N=110;
const int MOD=20090717;
int trie[N][26],fail[N],cnt[N],idx;
int n,m,k;
string s;
int dp[30][110][1<<10]; //dp[i][j][k]:走到第i步 到达j结点 状态为k 的方案数 
int num[1<<10]; //num[i]:状态为i的1的数目 void insert(string s,int id){int p=0;for(int i=0;s[i];++i){int c=s[i]-'a';if(!trie[p][c]) trie[p][c]=++idx;p=trie[p][c];}cnt[p]=1<<id;
}void getfail(){queue<int> q;for(int i=0;i<26;++i){if(trie[0][i])q.push(trie[0][i]);fail[trie[0][i]]=0;}while(q.size()){int now=q.front();q.pop();cnt[now]|=cnt[fail[now]]; //因为提到 字符串 后缀包含 for(int i=0;i<26;++i){if(trie[now][i]){fail[trie[now][i]]=trie[fail[now]][i];q.push(trie[now][i]);}elsetrie[now][i]=trie[fail[now]][i];}}
}void getsum(){for(int i=0;i<(1<<10);++i){num[i]=0;for(int j=0;j<10;++j)if(i&(1<<j)) num[i]++;}
} int main(){ios::sync_with_stdio(0);cin.tie(0);cout.tie(0);getsum(); //预处理 while(cin>>n>>m>>k && (n||m||k)){memset(trie,0,sizeof trie);memset(fail,0,sizeof fail);memset(cnt,0,sizeof cnt);idx=0; memset(dp,0,sizeof dp);for(int i=1;i<=m;++i) {cin>>s;insert(s,i-1);}getfail();dp[0][0][0]=1; for(int i=0;i<n;++i){ //遍历字符 for(int j=0;j<=idx;++j){ //遍历结点编号 for(int kk=0;kk<(1<<m);++kk){ //遍历状态 if(dp[i][j][kk]){for(int id=0;id<26;++id){ //遍历j号点下面的各个分支点 int u=trie[j][id];int state=kk|cnt[u];dp[i+1][u][state]+=dp[i][j][kk];dp[i+1][u][state]%=MOD;}} }}} int ans=0;for(int i=0;i<(1<<m);++i){
//			cout<<num[i]<<endl;if(num[i]>=k){for(int j=0;j<=idx;++j){ans=(ans+dp[n][j][i])%MOD;}}}cout<<ans<<endl;}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/318979.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

学习Rust的第22天:mini_grep第2部分

书接上文&#xff0c;在本文中&#xff0c;我们学习了如何通过将 Rust 程序的逻辑移至单独的库箱中并采用测试驱动开发 (TDD) 实践来重构 Rust 程序。通过在实现功能之前编写测试&#xff0c;我们确保了代码的可靠性。我们涵盖了基本的 Rust 概念&#xff0c;例如错误处理、环境…

Iterator迭代器接口介绍

Iterator迭代器接口介绍 Collection接口继承了Iterable接口&#xff0c;在接口中包含一个名为iterator的抽象方法&#xff0c;所以实现了Collection接口的容器类对该方法做了具体实现。iterator方法会返回一个Iterator接口类型的迭代器对象&#xff0c;在该对象中包含了三个方…

虹科Pico汽车示波器 | 免拆诊断案例 | 起动机免拆诊断故障 2 例

电磁开关、换向器烧蚀及炭刷磨损均会导致起动机偶尔不工作&#xff0c;使发动机偶尔无法起动。由于故障是偶发的&#xff0c;且没有故障代码&#xff0c;这往往会让维修人员无从下手&#xff0c;而用Pico示波器测量起动电流&#xff0c;就会让这些“亚健康状态”一目了然。 案例…

介绍BCD码

BCD码&#xff08;Binary-Coded Decimal‎&#xff09;&#xff0c;用4位 二进制数 来表示1位 十进制数 中的0~9这10个数码&#xff0c;是一种二进制的数字编码形式&#xff0c;用 二进制编码的十进制 代码。 BCD码这种编码形式利用了四个位元来储存一个十进制的数码&#xff0…

openlayer 使用ol-ext插件实现凸显区域

使用ol-ext插件实现凸显多变形 效果如图 1、创建openlayer var map; var view; var tileLayer, source, vector;function init() {tileLayer new ol.layer.Tile({source: new ol.source.TileArcGISRest({url: "http://map.geoq.cn/arcgis/rest/services/ChinaOnlineStr…

组合数问题

1.直接用递推&#xff1a; 下面是AC代码“&#xff1a; #include<bits/stdc.h> using namespace std; const int N2010,mod1e97; int a[N][N]; void init() {for(int i0;i<N;i){for(int j0;j<i;j){if(j0) a[i][j]1;else a[i][j](a[i-1][j]a[i-1][j-1])%mod;}} } i…

Stm32CubeMX 为 stm32mp135d 添加 adc

Stm32CubeMX 为 stm32mp135d 添加 adc 一、启用设备1. adc 设备添加2. adc 引脚配置2. adc 时钟配置 二、 生成代码1. optee 配置 adc 时钟和安全验证2. linux adc 设备 dts 配置 bringup 可参考&#xff1a; Stm32CubeMX 生成设备树 一、启用设备 1. adc 设备添加 启用adc设…

指令寻址——顺序寻址、跳跃寻址

目录 一、概述 1.定义 2.寻址方式分类 3.形式地址、物理地址 二、指令寻址 1、顺序寻址方式 2、跳跃寻址方式 一、概述 1.定义 寻址方式解决的是指如何在指令中表示一个操作数的地址&#xff0c;如何用这种表示得到操作数、或怎样计算出操作数的地址。 2.寻址方式分类…

ElasticSearch教程入门到精通——第一部分(基于ELK技术栈elasticsearch 8.x新特性)

ElasticSearch教程入门到精通——第一部分&#xff08;基于ELK技术栈elasticsearch 8.x新特性&#xff09; 1. ElasticSearch安装&#xff08;略&#xff09;2. ElasticSearch基础功能2.1 索引操作2.1.1 创建索引2.1.2 Head 索引2.1.3 查询索引2.1.3.1 查询单独索引2.1.3.2 查询…

linus下Anaconda创建虚拟环境pytorch

一、虚拟环境 1.创建 输入下面命令 conda create -n env_name python3.8 输入y 2.激活环境 输入 conda activate env_name 二、一些常用的命令 在Linux的控制平台 切换到当前的文件夹 cd /根目录/次目录 查看conda目录 conda list 查看pip目录 pip list查看历史命…

springboot mongodb分片集群事务

前置 mongodb分片集群想要使用事务,需要对应分片没有仲裁节点 代码 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-mongodb</artifactId><version>2.1.0.RELEASE</version></d…

数据结构可视化(适合考研党)

废话不多说传送门 还在疑惑平衡二叉树、红黑树、B树、B树怎么插入构建的吗&#xff0c;不要慌张&#xff0c;这个网站会一步一步来演示.&#xff0c;听了咸鱼的课还不够&#xff0c;需要自己动手模拟一下各种数据结构的CRUD&#xff01;&#xff01;

JavaEE初阶-多线程易忘点总结

文章目录 1.PCBPID文件描述符表内存指针状态上下文优先级记账信息tgid 2.线程与进程的区别3.sleep和interrupt方法的关系变量终止线程interrupt方法终止线程 4.线程状态5.出现线程不安全的原因线程在系统中是随即调度&#xff0c;抢占式执行的。多个线程修改同一个变量线程针对…

Pycharm新建工程时使用Python自带解释器的方法

Pycharm新建工程时使用Python自带解释器的方法 新建Project时最好不要新建Python解释器&#xff0c;实践证明&#xff0c;自己新建的Python解释器容易出现各种意想不到的问题。 那么怎样使用Python安装时自带的解释器呢&#xff1f; 看下面的三张截图大家就清楚了。 我的Pyth…

【大语言模型LLM】-基于ChatGPT搭建客服助手(1)

&#x1f525;博客主页&#xff1a;西瓜WiFi &#x1f3a5;系列专栏&#xff1a;《大语言模型》 很多非常有趣的模型&#xff0c;值得收藏&#xff0c;满足大家的收集癖&#xff01; 如果觉得有用&#xff0c;请三连&#x1f44d;⭐❤️&#xff0c;谢谢&#xff01; 长期不…

数据库(MySQL)—— 多表查询

数据库&#xff08;MySQL&#xff09;—— 多表查询 多表关系一对多多对多一对一多表查询概述数据准备查询形式笛卡尔积 分类连接查询内连接外连接左外连接右外连接 自连接联合查询 今天我们来进入MySQL中一个非常重要的部分&#xff1a;多表查询&#xff1a; 多表关系 多表关…

正点原子[第二期]Linux之ARM(MX6U)裸机篇学习笔记-9.1-LED灯(模仿STM32驱动开发实验)

前言&#xff1a; 本文是根据哔哩哔哩网站上“正点原子[第二期]Linux之ARM&#xff08;MX6U&#xff09;裸机篇”视频的学习笔记&#xff0c;在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了正点原子教学视频和链接中的内容。…

MySQL技能树学习——数据库组成

数据库组成&#xff1a; 数据库是一个组织和存储数据的系统&#xff0c;它由多个组件组成&#xff0c;这些组件共同工作以确保数据的安全、可靠和高效的存储和访问。数据库的主要组成部分包括&#xff1a; 数据库管理系统&#xff08;DBMS&#xff09;&#xff1a; 数据库管理系…

eNSP-抓包解析HTTP、FTP、DNS协议

一、环境搭建 1.http服务器搭建 2.FTP服务器搭建 3.DNS服务器搭建 二、抓包 三、http协议 1.HTTP协议&#xff0c;建立在TCP协议之上 2.http请求 3.http响应 请求响应报文参考&#xff1a;https://it-chengzi.blog.csdn.net/article/details/113809803 4.浏览器开发者工具抓包…

爬虫自动化之drissionpage实现随时切换代理ip

目录 一、视频二、dp首次启动设置代理三、dp利用插件随时切换代理一、视频 视频直接点击学习SwitchyOmega插件使用其它二、dp首次启动设置代理 from DrissionPage import ChromiumPage, ChromiumOptions from loguru