ArcTan

dfs

随笔 - 16, 文章 - 117, 评论 - 6, 引用 - 0

数据加载中……

Trie树

Trie树就是字符树，其核心思想就是空间换时间

举个简单的例子。

给你100000个长度不超过10的单词。对于每一个单词，我们要判断他出没出现过，如果出现了，第一次出现第几个位置。

这题当然可以用hash来，但是我要介绍的是trie树。在某些方面它的用途更大。比如说对于某一个单词，我要询问它的前缀是否出现过。这样hash就不好搞了，而用trie还是很简单。

现在回到例子中，如果我们用最傻的方法，对于每一个单词，我们都要去查找它前面的单词中是否有它。那么这个算法的复杂度就是O(n^2)。显然对于100000的范围难以接受。现在我们换个思路想。假设我要查询的单词是abcd，那么在他前面的单词中，以b，c，d，f之类开头的我显然不必考虑。而只要找以a开头的中是否存在abcd就可以了。同样的，在以a开头中的单词中，我们只要考虑以b作为第二个字母的……这样一个树的模型就渐渐清晰了……

假设有b，abc，abd，bcd，abcd，efg，hii这6个单词，我们构建的树就是这样的。

对于每一个节点，从根遍历到他的过程就是一个单词，如果这个节点被标记为红色，就表示这个单词存在，否则不存在。

那么，对于一个单词，我只要顺着他从跟走到对应的节点，再看这个节点是否被标记为红色就可以知道它是否出现过了。把这个节点标记为红色，就相当于插入了这个单词。

这样一来我们询问和插入可以一起完成，所用时间仅仅为单词长度，在这一个样例，便是10。

我们可以看到，trie树每一层的节点数是26^i级别的。所以为了节省空间。我们用动态链表，或者用数组来模拟动态。空间的花费，不会超过单词数×单词长度。

posted on 2012-08-22 09:26 wangs 阅读(2349) 评论(0) 编辑收藏引用所属分类: ACM-数据结构

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！

相关文章: 二维线段树-子矩阵和 Trie树 poj 1182食物链(并查集的应用) 并查集基础和的应用 poj 3468 线段树 hdu 2419 (STL：set multiset) poj2832(单调队列)----原来就是贪心啊！！！ poj 2082(单调栈)数学味有点重哦 poj3250(单调栈单调队列)-- poj 3494（单调栈-求矩阵面积）数据压缩技巧

网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

ArcTan

Trie树

导航

常用链接

留言簿(1)

随笔档案(16)

文章分类(116)

文章档案(117)

搜索

最新评论

阅读排行榜

评论排行榜