本质我认为应该是树(trie树)上kmp 参考http://www.cppblog.com/mythit/archive/2009/04/21/80633.html 网上很多的教程都是看了他的博客或借鉴而来的 第一部分建trie树 将字符串一位一位的加进去 如果这个字符为NULL则加一个指针将头指针指向这个点继续操作 插入完成之后我们给最后一个点的count+1(相当于只有是匹配串的末尾才计数)(刚开始没听懂的时候老觉得AC自动机或是trie图有漏洞)
第二部分fail指针 第一层入队 逐层入队 考虑入队后的一个点 去找他父亲的fail指针下的点(即将要出队的点的fail->)有没有指向自己的next指针 如果有就将fail指针指向他否则指向他父亲的fail指针下的点 如果没有就继续fail的跳fail直到跳到根节点如果还没有就结束(!并不建议这么写有些问题可以将边界条件变成NULL) 思想可以类比kmp的next数组的推法 tail++ …… 考虑一要出队的点
按字典序进行上述操作 当不是NULL的指针都遍历了一次之后 head++
root为现在要出队的点 实际只需要不断的出队 当出队时会有新的字符补进来 如果head=tail则必然所有的点都标了fail指针 特别地有,当root出队时即第一个点出队时所有的子节点的fail指针必然指向root 所以让root的指针指向自己可以符合上述操作的一致性(如果上面出队判断为跳到NULL则root的fail应指向NULL这种写法较简单)
第三部分 查询 如果这个字符匹配那么继续匹配(看next指针是不是NULL) 如果这个字符的count不是1即不是末尾 如果是就加 否则沿fail的指针继续匹配
上代码
#include<bits/stdc++.h> using namespace std; const int kind=26; char str[1000005]; char keyword[51]; struct node{ node *fail; node *next[kind]; int count; node(){ fail=NULL; count=0; memset(next,NULL,sizeof(next)); } }*q[500001]; int head,tail; void insert(char *str,node *root){ node *p=root; int i=0,index; while(str[i]){ index=str[i]-'a'; if(p->next[index]==NULL) p->next[index]=new node(); p=p->next[index]; i++ ; } p->count++; } void build_fail(node *root){ int i; root->fail=NULL; q[head++]=root; while(head!=tail){ node *temp=q[tail++]; node *p=NULL; for(int i=0;i<26;i++){ if(temp->next[i]!=NULL){ if(temp==root) temp->next[i]->fail=root; else{ p=temp->fail; while(p!=NULL){ if(p->next[i]!=NULL){ temp->next[i]->fail=p->next[i]; break; } p=p->fail; } if(p==NULL) temp->next[i]->fail=root; } q[head++]=temp->next[i]; } } } } int query(node *root){ int i=0,index,cnt=0,len=strlen(str); node *p=root; while(str[i]){ index=str[i]-'a'; while(p->next[index]==NULL&&p!=root) p=p->fail; p=p->next[index]; if(p==NULL) p=root; node *temp=p; while(temp!=root&&temp->count!=-1){ cnt+=temp->count; temp->count=-1; temp=temp->fail; } i++; } return cnt; } int main() { int n,t; scanf("%d",&t); while(t--){ head=tail=0; node *root=new node(); scanf("%d",&n); getchar(); while(n--){ gets(keyword); insert(keyword,root); } build_fail(root); scanf("%s",str); printf("%d\n",query(root)); } return 0; }