B-tree详解及实现(C语言)

xiaoxiao2021-02-27  183

M阶的B-tree是一棵具有下列结构特性的树: (1)树的根或者是一片树叶,或者其儿子树在2到M之间。 (2)除根外,所有非树叶节点的儿子数在[M/2]到M之间。(符号[]表示向上取整) (3)所有树叶都在相同的深度上。 所有的数据都存储在树叶上。也有把数据存储在内部节点的,但我这里选择前者,内部节点只是用来索引。在每一个内部节点上皆含有指向该节点各个儿子的指针P1,P2...,PM和分别代表在子树P2,P3 ... PM中发现的最小关键字的值k1,k2 ... kM-1。当然有些指针是NULL。而其对应的ki则是未定义的。对于每一个节点,其子树P1中所有的关键字都小于子树P2的关键字,如此等等。另外我们还要求在(非根)树叶中关键字的个数也在[M/2]和M之间。下图是一棵4阶B-tree。 4阶B-tree的流行称呼是2-3-4树,而3阶称为2-3树。下面使用2-3树来介绍B-tree的插入与删除。 1. B-tree的插入 下面来演示B-tree的插入过程。初始状态如下: 下面插入18,正好不破坏树的结构: 插入19,发现树叶已经满了,而且兄弟节点也是满的。所以将该树叶的元素一分为二。更新其符节点的键,得到下图: 尝试插入4,发现树叶已经满了,但是其兄弟节点还没有满。所以将一个元素分给兄弟,更新父节点。得到下图: 尝试插入1,发现树叶已满,而且兄弟也满了。更糟糕的是,其父节点的子树数也满了。这个时候必须分裂节点。然后逐级往上修改节点,如果节点不满条件,必须沿着路劲一直修改的根。甚至是生成新的根。下面是这次插入的过程(橘色表示新生成的节点): 现在插入21,没有破坏树的结构,只是更新路径上的节点的键值。 现在插入65,就必须一直分裂节点一直到根处,发现根的元素也满,必须要生成新的根。下面的一组图描述了这个过程。 总结一下插入的过程:对于一般的M阶B树,当插入一个关键字使得该节点的关键字超过M。我们可以先查看相邻的兄弟节点中有没有未满的。如有,将一个关键字插入到兄弟节点中。如果兄弟节点都满了。那么必须分裂该节点。分裂的两个节点各有一半关键字。然而这使得父节点多出一个儿子,因此我们必须检查父节点是否已经具有M个儿子,如果是,那么这个父节点也要分裂成两个节点。我们重复这个过程直到找到一个父节点具有少于M个儿子。如果分裂了根节点,那么就必须生成一个新的根。注意,在这个过程中要更新节点信息。 2. B-tree的删除 B-tree的删除是这样的过程。从根节点一直寻找直到树叶节点,找到该关键字。如果这个关键字数目只有[M/2],那么将它除去之后关键字少于[M/2]了。此时有两种情况: (1)相邻的兄弟节点具有大于[M/2]的关键字 取兄弟节点的一个关键字添加在该节点中。 (2)相邻的兄弟节点只有[M/2]个关键字。 这个时候两个节点就必须合并成一个节点。假如此时父亲节点只有[M/2]个儿子。那么父亲节点也要执行合并的操作。我们重复这个过程直到找到一个父节点,其父节点具有大于[M/2]个儿子。如果到最后,根节点之后一个儿子,那么删除根节点,其儿子成为新的根。 3. B-tree的实现 B-tree的实现我实际上是从B+ Tree中修改得来的。实际上Key[0]保存了第一棵子树的最小值,所以除了树叶之外,内部节点的key值是从1开始的,只有树叶从0开始。这样做在代码实现上使得代码更加清晰(因为我也写过内部节点Key从0开始),速度也更快(不用使用FindMin来寻找一棵树的最小值)。下面我贴出实现代码。关于B+ tree的代码我已经写好,之后再发一篇帖子。 3.1 头文件 // // MBTree.h // MBTree // // Created by Wuyixin on 2017/8/4. // Copyright © 2017年 Coding365. All rights reserved. // #ifndef MBTree_h #define MBTree_h #include <stdio.h> #include <stdlib.h> #include <limits.h> #define M (4) #define LIMIT_M_2 (M % 2 ? (M + 1)/2 : M/2) typedef struct MBNode *MBTree,*Position; typedef int KeyType; struct MBNode{ int KeyNum;/* 关键字个数 */ KeyType Key[M + 1];/* 内部节点从1开始(实际上0的位置存储了第一棵子树的最小值),树叶节点从0开始 */ MBTree Children[M + 1];/* 存储M个孩子节点 */ }; /* 初始化 */ extern MBTree Initialize(); /* 插入 */ extern MBTree Insert(MBTree T,KeyType Key); /* 删除 */ extern MBTree Remove(MBTree T,KeyType Key); /* 销毁 */ extern MBTree Destroy(MBTree T); /* 遍历节点 */ extern void Travel(MBTree T); #endif /* MBTree_h */ 3.2 实现文件 // // MBTree.c // MBTree // // Created by Wuyixin on 2017/8/4. // Copyright © 2017年 Coding365. All rights reserved. // #include "MBTree.h" static KeyType Unavailable = INT_MIN; /* 生成节点并初始化 */ static MBTree MallocNewNode(){ MBTree NewNode; int i; NewNode = malloc(sizeof(struct MBNode)); if (NewNode == NULL) exit(EXIT_FAILURE); i = 0; while (i < M + 1){ NewNode->Key[i] = Unavailable; NewNode->Children[i] = NULL; i++; } NewNode->KeyNum = 0; return NewNode; } /* 初始化 */ extern MBTree Initialize(){ MBTree T; if (M < (3)){ printf("M最小等于3!"); exit(EXIT_FAILURE); } /* 根结点 */ T = MallocNewNode(); return T; } /* 寻找一个兄弟节点,其存储的关键字未满,否则返回NULL */ static Position FindSibling(Position Parent,int i){ Position Sibling; int Limit; Limit = M; Sibling = NULL; if (i == 0){ if (Parent->Children[1]->KeyNum < Limit) Sibling = Parent->Children[1]; } else if (Parent->Children[i - 1]->KeyNum < Limit) Sibling = Parent->Children[i - 1]; else if (i + 1 < Parent->KeyNum && Parent->Children[i + 1]->KeyNum < Limit){ Sibling = Parent->Children[i + 1]; } return Sibling; } /* 查找兄弟节点,其关键字数大于M/2 ;没有返回NULL*/ static Position FindSiblingKeyNum_M_2(Position Parent,int i,int *j){ int Limit; Position Sibling; Sibling = NULL; Limit = LIMIT_M_2; if (i == 0){ if (Parent->Children[1]->KeyNum > Limit){ Sibling = Parent->Children[1]; *j = 1; } } else{ if (Parent->Children[i - 1]->KeyNum > Limit){ Sibling = Parent->Children[i - 1]; *j = i - 1; } else if (i + 1 < Parent->KeyNum && Parent->Children[i + 1]->KeyNum > Limit){ Sibling = Parent->Children[i + 1]; *j = i + 1; } } return Sibling; } /* 当要对X插入Key的时候,i是X在Parent的位置,j是Key要插入的位置 当要对Parent插入X节点的时候,i是要插入的位置,Key和j的值没有用 */ static Position InsertElement(int isKey, Position Parent,Position X,KeyType Key,int i,int j){ int k; if (isKey){ /* 插入key */ k = X->KeyNum - 1; while (k >= j){ X->Key[k + 1] = X->Key[k];k--; } X->Key[j] = Key; if (Parent != NULL) Parent->Key[i] = X->Key[0]; X->KeyNum++; }else{ /* 插入节点 */ k = Parent->KeyNum - 1; while (k >= i){ Parent->Children[k + 1] = Parent->Children[k]; Parent->Key[k + 1] = Parent->Key[k]; k--; } Parent->Key[i] = X->Key[0]; Parent->Children[i] = X; Parent->KeyNum++; } return X; } static Position RemoveElement(int isKey, Position Parent,Position X,int i,int j){ int k,Limit; if (isKey){ Limit = X->KeyNum; /* 删除key */ k = j + 1; while (k < Limit){ X->Key[k - 1] = X->Key[k];k++; } X->Key[X->KeyNum - 1] = Unavailable; Parent->Key[i] = X->Key[0]; X->KeyNum--; }else{ /* 删除节点 */ Limit = Parent->KeyNum; k = i + 1; while (k < Limit){ Parent->Children[k - 1] = Parent->Children[k]; Parent->Key[k - 1] = Parent->Key[k]; k++; } Parent->Children[Parent->KeyNum - 1] = NULL; Parent->Key[Parent->KeyNum - 1] = Unavailable; Parent->KeyNum--; } return X; } /* Src和Dst是两个相邻的节点,i是Src在Parent中的位置; 将Src的元素移动到Dst中 ,n是移动元素的个数*/ static Position MoveElement(Position Src,Position Dst,Position Parent,int i,int n){ KeyType TmpKey; Position Child; int j,SrcInFront; SrcInFront = 0; if (Src->Key[0] < Dst->Key[0]) SrcInFront = 1; j = 0; /* 节点Src在Dst前面 */ if (SrcInFront){ if (Src->Children[0] != NULL){ while (j < n) { Child = Src->Children[Src->KeyNum - 1]; RemoveElement(0, Src, Child, Src->KeyNum - 1, Unavailable); InsertElement(0, Dst, Child, Unavailable, 0, Unavailable); j++; } }else{ while (j < n) { TmpKey = Src->Key[Src->KeyNum -1]; RemoveElement(1, Parent, Src, i, Src->KeyNum - 1); InsertElement(1, Parent, Dst, TmpKey, i + 1, 0); j++; } } Parent->Key[i + 1] = Dst->Key[0]; }else{ if (Src->Children[0] != NULL){ while (j < n) { Child = Src->Children[0]; RemoveElement(0, Src, Child, 0, Unavailable); InsertElement(0, Dst, Child, Unavailable, Dst->KeyNum, Unavailable); j++; } }else{ while (j < n) { TmpKey = Src->Key[0]; RemoveElement(1, Parent, Src, i, 0); InsertElement(1, Parent, Dst, TmpKey, i - 1, Dst->KeyNum); j++; } } Parent->Key[i] = Src->Key[0]; } return Parent; } /* 分裂节点 */ static MBTree SplitNode(Position Parent,Position X,int i){ int j,k,Limit; Position NewNode; NewNode = MallocNewNode(); k = 0; j = X->KeyNum / 2; Limit = X->KeyNum; while (j < Limit){ if (X->Children[0] != NULL){ NewNode->Children[k] = X->Children[j]; X->Children[j] = NULL; } NewNode->Key[k] = X->Key[j]; X->Key[j] = Unavailable; NewNode->KeyNum++;X->KeyNum--; j++;k++; } if (Parent != NULL) InsertElement(0, Parent, NewNode, Unavailable, i + 1, Unavailable); else{ /* 如果是X是根,那么创建新的根并返回 */ Parent = MallocNewNode(); InsertElement(0, Parent, X, Unavailable, 0, Unavailable); InsertElement(0, Parent, NewNode, Unavailable, 1, Unavailable); return Parent; } return X; } /* 合并节点,X只有一个关键字,S有大于或等于M/2个关键字*/ static Position MergeNode(Position Parent, Position X,Position S,int i){ int Limit; /* S的关键字数目大于M/2 */ if (S->KeyNum > LIMIT_M_2){ /* 从S中移动一个元素到X中 */ MoveElement(S, X, Parent, i,1); }else{ /* 将X全部元素移动到S中,并把X删除 */ Limit = X->KeyNum; MoveElement(X,S, Parent, i,Limit); RemoveElement(0, Parent, X, i, Unavailable); free(X); X = NULL; } return Parent; } static MBTree RecursiveInsert(MBTree T,KeyType Key,int i,MBTree Parent){ int j,Limit; Position Sibling; /* 查找分支 */ j = 0; while (j < T->KeyNum && Key >= T->Key[j]){ /* 重复值不插入 */ if (Key == T->Key[j]) return T; j++; } if (j != 0 && T->Children[0] != NULL) j--; /* 树叶 */ if (T->Children[0] == NULL) T = InsertElement(1, Parent, T, Key, i, j); /* 内部节点 */ else T->Children[j] = RecursiveInsert(T->Children[j], Key, j, T); /* 调整节点 */ Limit = M; if (T->KeyNum > Limit){ /* 根 */ if (Parent == NULL){ /* 分裂节点 */ T = SplitNode(Parent, T, i); } else{ Sibling = FindSibling(Parent, i); if (Sibling != NULL){ /* 将T的一个元素(Key或者Child)移动的Sibing中 */ MoveElement(T, Sibling, Parent, i, 1); }else{ /* 分裂节点 */ T = SplitNode(Parent, T, i); } } } if (Parent != NULL) Parent->Key[i] = T->Key[0]; return T; } /* 插入 */ extern MBTree Insert(MBTree T,KeyType Key){ return RecursiveInsert(T, Key, 0, NULL); } static MBTree RecursiveRemove(MBTree T,KeyType Key,int i,MBTree Parent){ int j,NeedAdjust; Position Sibling,Tmp; Sibling = NULL; /* 查找分支 */ j = 0; while (j < T->KeyNum && Key >= T->Key[j]){ if (Key == T->Key[j]) break; j++; } if (T->Children[0] == NULL){ /* 没找到 */ if (Key != T->Key[j] || j == T->KeyNum) return T; }else if (j == T->KeyNum || Key < T->Key[j]) j--; /* 树叶 */ if (T->Children[0] == NULL){ T = RemoveElement(1, Parent, T, i, j); }else{ T->Children[j] = RecursiveRemove(T->Children[j], Key, j, T); } NeedAdjust = 0; /* 树的根或者是一片树叶,或者其儿子数在2到M之间 */ if (Parent == NULL && T->Children[0] != NULL && T->KeyNum < 2) NeedAdjust = 1; /* 除根外,所有非树叶节点的儿子数在[M/2]到M之间。(符号[]表示向上取整) */ else if (Parent != NULL && T->Children[0] != NULL && T->KeyNum < LIMIT_M_2) NeedAdjust = 1; /* (非根)树叶中关键字的个数也在[M/2]和M之间 */ else if (Parent != NULL && T->Children[0] == NULL && T->KeyNum < LIMIT_M_2) NeedAdjust = 1; /* 调整节点 */ if (NeedAdjust){ /* 根 */ if (Parent == NULL){ if(T->Children[0] != NULL && T->KeyNum < 2){ Tmp = T; T = T->Children[0]; free(Tmp); return T; } }else{ /* 查找兄弟节点,其关键字数目大于M/2 */ Sibling = FindSiblingKeyNum_M_2(Parent, i,&j); if (Sibling != NULL){ MoveElement(Sibling, T, Parent, j, 1); }else{ if (i == 0) Sibling = Parent->Children[1]; else Sibling = Parent->Children[i - 1]; Parent = MergeNode(Parent, T, Sibling, i); T = Parent->Children[i]; } } } return T; } /* 删除 */ extern MBTree Remove(MBTree T,KeyType Key){ return RecursiveRemove(T, Key, 0, NULL); } /* 销毁 */ extern MBTree Destroy(MBTree T){ int i,j; if (T != NULL){ i = 0; while (i < T->KeyNum + 1){ Destroy(T->Children[i]);i++; } printf("Destroy:("); /* 树叶的Key从0开始,内部节点从1开始 */ if (T->Children[0] == NULL) j = 0; else j = 1; while (j < T->KeyNum)/* T->Key[i] != Unavailable*/ printf("%d:",T->Key[j++]); printf(") "); free(T); T = NULL; } return T; } static void RecursiveTravel(MBTree T,int Level){ int i; if (T != NULL){ printf(" "); printf("[Level:%d]-->",Level); printf("("); /* 树叶的Key从0开始,内部节点从1开始 */ if (T->Children[0] == NULL) i = 0; else i = 1; while (i < T->KeyNum)/* T->Key[i] != Unavailable*/ printf("%d:",T->Key[i++]); printf(")"); Level++; i = 0; while (i <= T->KeyNum) { RecursiveTravel(T->Children[i], Level); i++; } } } /* 遍历 */ extern void Travel(MBTree T){ RecursiveTravel(T, 0); printf("\n"); } 3.3 调用 // // main.c // MBTree // // Created by Wuyixin on 2017/8/4. // Copyright © 2017年 Coding365. All rights reserved. // #include <stdio.h> #include <time.h> #include "MBTree.h" int main(int argc, const char * argv[]) { MBTree T; T = Initialize(); clock_t c1 = clock(); int i = 50000000; while (i > 0) T = Insert(T, i--); i = 50000001; while (i < 100000000) T = Insert(T, i++); i = 100000000; while (i > 100) T = Remove(T, i--); Travel(T); Destroy(T); clock_t c2 = clock(); printf("\n用时: %lu秒\n",(c2 - c1)/CLOCKS_PER_SEC); return 0; }
转载请注明原文地址: https://www.6miu.com/read-16576.html

最新回复(0)