字典树的数据结构
字典树的数据结构
字典树,即 Trie 树,又称单词查找树或键树,是一种树形结构。典型应用是用于统计和排 序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。
它的优点是:最大限度地减少 无谓的字符串比较,查询效率 比哈希表高。
字典树的基本性质
- 结点本身不存完整单词。
- 从根结点到某一结点,路径上经过的字符连接起来,为该结点对应的 字符串。
- 每个结点的所有子结点路径代表的字符都不相同。
字典树的核心思想
Trie 树的核心思想是空间换时间。
利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。
并查集
适用场景:组团、配对问题。
基本操作
- makeSet(s):建立一个新的并查集,其中包含 s 个单元素集合。
- unionSet(x, y):把元素 x 和元素 y 所在的集合合并,要求 x 和 y 所在
的集合不相交,如果相交则不合并。 - find(x):找到元素 x 所在的集合的代表,该操作也可以用于判断两个元 素是否位于同一个集合,只要将它们各自的代表比较一下就可以了。
高级搜索
- 朴素搜索
- 优化方式:不重复(fibonacci)、剪枝(生成括号问题)
- 搜索方向:
- DFS: depth first search 深度优先搜索
- BFS: breadth first search 广度优先搜索
- 双向搜索
- 启发式搜索
平衡二叉树 AVL 树
- 发明者 G. M. Adelson-Velsky 和 Evgenii Landis 。
- Balance Factor(平衡因子): 是它的左子树的高度减去它的右子树的高度(有时相反)。 balancefactor={-1, 0, 1}
- 通过旋转操作来进行平衡(四种)。
- 平衡二叉树有多种,常见为 AVL 树、红黑树。
旋转操作
- 左旋
- 右旋
- 左右旋
- 右左旋
您将是第一位评论人!