trie树（字典树）

Trie树（字典树）

Trie树就是字符树，其核心思想就是空间换时间。

举个简单的例子。

给你100000个长度不超过10的单词。对于每一个单词，我们要判断他出没出现过，如果出现了，第一次出现第几个位置。

这题当然可以用hash来，但是我要介绍的是trie树。在某些方面它的用途更大。比如说对于某一个单词，我要询问它的前缀是否出现过。这样hash就不好搞了，而用trie还是很简单。

现在回到例子中，如果我们用最傻的方法，对于每一个单词，我们都要去查找它前面的单词中是否有它。那么这个算法的复杂度就是O(n^2)。显然对于100000的范围难以接受。现在我们换个思路想。假设我要查询的单词是abcd，那么在他前面的单词中，以b，c，d，f之类开头的我显然不必考虑。而只要找以a开头的中是否存在abcd就可以了。同样的，在以a开头中的单词中，我们只要考虑以b作为第二个字母的……这样一个树的模型就渐渐清晰了……

假设有b，abc，abd，bcd，abcd，efg，hii这6个单词，我们构建的树就是这样的。

对于每一个节点，从根遍历到他的过程就是一个单词，如果这个节点被标记为红色，就表示这个单词存在，否则不存在。

那么，对于一个单词，我只要顺着他从跟走到对应的节点，再看这个节点是否被标记为红色就可以知道它是否出现过了。把这个节点标记为红色，就相当于插入了这个单词。

这样一来我们询问和插入可以一起完成，所用时间仅仅为单词长度，在这一个样例，便是10。

我们可以看到，trie树每一层的节点数是26^i级别的。所以为了节省空间。我们用动态链表，或者用数组来模拟动态。空间的花费，不会超过单词数×单词长度。

posted on 2008-04-05 20:02 zoyi 阅读(353) 评论(0) 编辑收藏引用

朋友

搜索

最新评论

1. re: 欧拉定理证明 && 欧拉公式
@我没有名字
@我没有名字
因为a * xi 与n互质，所以a * xi mod n与n互质，又因为a * xi mod n < n, 所以 a * xi mod n ∈ Zn
--煎蛋
2. re: 大素数的检验
好文章~
--vcvycy
3. re: 大素数的检验
@菜鸟

1007不是素数
--edwinkoo
4. re: 大素数的检验[未登录]
评论内容较长,点击标题查看
--菜鸟
5. re: 欧拉定理证明 && 欧拉公式
评论内容较长,点击标题查看
--我没有名字

阅读排行榜

评论排行榜

常用链接

留言簿(8)

随笔分类

随笔档案

文章档案

相册

acmer

online judge

队友

技术

朋友

搜索

最新评论

阅读排行榜

评论排行榜

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！



网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理