1、定义
高效的存储和查找字符串集合的数据结构
它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高
2、构建
我们可以使用数组来模拟实现Trie树。
我们设计一个二维数组 son[N] [26] 来模拟整个树的结构,而cnt[N] 来记录单词个数。
举个例子: son[1][1]=2 代表的是 1号节点 的一个值为b的节点 是 2号节点。而son[1][0]=0 则表示1号节点不存在 值为 a 的节点。
3、代码分析
1、定义
son[N][26]
下标是x的点
x这个节点的所有的儿子是去存储到son[x][26]里面
son[x][0]就是第一个节点 son[x][1]就是第二个节点
cont[x]表示以x为结尾的单词有多少个
int son[N][26], cnt[N], idx;
// 0号点既是根节点,又是空节点
// son[][]存储树中每个节点的子节点
// cnt[]存储以每个节点结尾的单词数量
2、插入操作
// 插入一个字符串
void insert(char *str)
{int p = 0;//从根节点开始,从前往后遍历for (int i = 0; str[i]; i ++ ){//将a-z 映射成 0 - 25int u = str[i] - 'a';//如果当前节点不存在 => p节点不存在u这个儿子//就创建出来if (!son[p][u]) son[p][u] = ++ idx;//将该值赋给pp = son[p][u];}//以该点为结尾的数字多了一个cnt[p] ++ ;
}
3、查询操作
// 查询字符串出现的次数
int query(char *str)
{//从根节点开始int p = 0;for (int i = 0; str[i]; i ++ ){int u = str[i] - 'a';//如果当前节点不存在子节点的话if (!son[p][u]) return 0;p = son[p][u];}//返回以p结尾的单词的数量return cnt[p];
}
3.题目
维护一个字符串集合,支持两种操作:
1、 I x向集合中插入一个字符串 x;
2、 Q x询问一个字符串在集合中出现了多少次。
共有 N个操作,所有输入的字符串总长度不超过10^5 ,字符串仅包含小写英文字母。
输入格式
第一行包含整数 N,表示操作数。
接下来 N行,每行包含一个操作指令,指令为 I x 或 Q x 中的一种。
输出格式
对于每个询问指令 Q x,都要输出一个整数作为结果,表示 x在集合中出现的次数。
每个结果占一行。
数据范围
1≤N≤2∗10^4
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
#include <iostream>using namespace std;const int N = 100010;int son[N][26],idx,cnt[N];
char str[N];//向集合中插入一个字符串 x
void insert(char str[])
{int p = 0;for (int i = 0; str[i]; i++){int u = str[i] - 'a';//将这个字符从a-z变成 0-25if (!son[p][u]) son[p][u] = ++idx;p = son[p][u];}cnt[p]++;
}//询问一个字符串在集合中出现了多少次
int query(char str[])
{int p = 0;for (int i = 0; str[i]; i++){int u = str[i] - 'a';if (!son[p][u]) return 0;p = son[p][u];}return cnt[p];
}int main()
{int n;cin >> n;while (n--){char op[2];cin >> op >> str;if (op[0] == 'I') insert(str);else cout << query(str)<< endl;}return 0;
}