B树与B+树索引

xiaoxiao2021-02-28  35

B 树

数据库结构使用树的结构索引,从算法逻辑上看,二叉查找树的查找速度和比较次数都是最小的。数据库的索引存储在磁盘上,当数据量比较大的时候,索引的大小可能有几个G 甚至更多。

当我们利用索引查询的时候,不可能把整个索引加载到内存,能做的只有逐一加载每一个磁盘页,磁盘页对应索引树的节点。

当利用二叉查找树时,每一层都是进行一次IO操作(即把对应的索引装入内存),因此最坏的情况下,磁盘的IO次数就等于索引树的高度。

为了减少IO次数,就需要把层数降低,也就是B-树 B树是一种多路平衡查找树,每一个节点最多包含k个孩子,k称为b树的阶,k的大小取决于磁盘页的大小,

m阶b树具有以下的特征。

1.根结点至少有两个子女。 2.每个中间节点都包含k-1个元素和k个孩子,其中 m/2 <= k <= m 3.每一个叶子节点都包含k-1个元素,其中 m/2 <= k <= m 4.所有的叶子结点都位于同一层。 5.每个节点中的元素从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域分划。

B + 树

B+ 树是B 树的一种变体,比B树的查询性能更高。

1.有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点。 所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。 3.所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。

B+树的好处主要体现在查询性能上,单点查询时,由于B+树中间节点没有数据,所有同样的磁盘页可以容纳更多的节点,也就是说,在数据量相同的情况下,b+ 树的结构比b树更加矮胖,IO次数也就更少。B+ 树的查询必须查到叶子节点,B树查询到匹配元素即可,所以B树查询性能不稳定。范围查询时,B 树只能中序遍历,而B+树只需要在链表中做遍历即可。所以B+ 树范围查询更加方便。

转载请注明原文地址: https://www.6miu.com/read-2602154.html

最新回复(0)