其他分享
首页 > 其他分享> > yxc_第二章 数据结构(二)_Trie树

yxc_第二章 数据结构(二)_Trie树

作者:互联网

目录

一、基本概念

二、AcWing 835 Trie字符串统计

本题思路:


一、基本概念

接下来的案例类似于邻接矩阵,横轴表示str[ i ] - 'a'(省略了7~25),竖轴表示节点编号。红色的数字表示行编号为其根节点,列编号为其对应字母的映射。例如红色的5表示,编号为2的节点有一个编号为5的子节点,而其对应的黑色的5,则表示该子节点元素对应的映射为5(f)

 

二、AcWing 835 Trie字符串统计

维护一个字符串集合,支持两种操作:

  1. I x 向集合中插入一个字符串 x;
  2. Q x 询问一个字符串在集合中出现了多少次。

共有 N 个操作,输入的字符串总长度不超过 10的5次方,字符串仅包含小写英文字母。

输入格式

第一行包含整数 N,表示操作数。

接下来 N 行,每行包含一个操作指令,指令为 I xQ x 中的一种。

输出格式

对于每个询问指令 Q x,都要输出一个整数作为结果,表示 x 在集合中出现的次数。

每个结果占一行。

数据范围

1≤N≤2∗10的4次方

输入样例:

5
I abc
Q abc
Q ab
I ab
Q ab

输出样例:

1
0
1
#include<iostream>
using namespace std;

const int N = 100010;

char str[N];
int son[N][26], cnt[N], idx;
//son表示编号为N的节点的子节点们的编号
//cnt表示以编号为N的节点结尾的字符串在集合中出现的个数
//(注意以编号为N的节点结尾的字符串的遍历路径唯一)
//idx表示当前正在操作的节点编号

void insert(char str[])//也可传 char *str
{
    int p = 0;//0既为头结点,又为空节点(类似线索二叉树)
    
    for (int i = 0; str[i]; i ++ )
    {
        int u = str[i] - 'a';//获取字符映射后的编号0~25
        if (!son[p][u]) son[p][u] = ++ idx;//表示p下面连接了一个u(映射后)的子节点,编号为idx
        p = son[p][u];//向下移动,重新将子节点作为根节点
    }
    
    cnt[p] ++ ;//以编号p为尾节点的字符串只有一个
}

int query(char str[])
{
    int p = 0;
    
    for (int i = 0; str[i]; i ++ )
    {
        int u = str[i] - 'a';
        if (!son[p][u]) return 0;//没找到该字符串,返回0
        p = son[p][u];
    }
    //循环结束后,说明存在以编号p为尾节点的字符串
    return cnt[p];
}

int main()
{
    int n;
    scanf("%d", &n);
    
    while (n -- )
    {
        char op[2];
        scanf("%s%s", op, str);//数组名本身也是表示首地址的指针,不用加取址符&
        //但是需要注意,该题的输入中操作和字符串之间还有一个空格,所以op其实是字符串
        if (op[0] == 'I') insert(str);//也可以if(*op == 'I')
        else printf("%d\n", query(str));
    }
    
    return 0;
}

本题思路:

本题就是Trie树的一个典型应用。所谓Trie树就是通过赋予每个节点一个唯一的编号,从而实现快速存储和查找字符串的数据结构。对于传进来的字符串从根节点开始遍历,凡是遇到不存在的节点,则新开辟一个,编号为++后的idx。这样可以保证每次传进来的字符串只要完全相同,最后一定会遍历同一个路径,而且路径终点p对应的cnt[ p ] ++ ;如果传进来的字符串从未出现过,则一定会有新编号的节点出现(idx ++ ),所以其cnt[ p ]也会从0变为1。

标签:Trie,++,int,str,编号,字符串,yxc,数据结构,节点
来源: https://blog.csdn.net/m0_56595384/article/details/122777502