B树与B+树全面解析

B树与B+树全面解析

  • 前言
  • 一、B 树的基本概念与结构特性
    • 1.1 B 树的定义
    • 1.2 B 树的结构特性
    • 1.3 B 树的节点结构示例
  • 二、B 树的基本操作
    • 2.1 查找操作
    • 2.2 插入操作
    • 2.3 删除操作
  • 三、B + 树的基本概念与结构特性
    • 3.1 B + 树的定义
    • 3.2 B + 树的结构特性
    • 3.3 B + 树的节点结构示例
  • 四、B 树与 B + 树的对比
  • 五、B 树与 B + 树的应用场景
    • 5.1 数据库索引
    • 5.2 文件系统
    • 5.3 其他场景
  • 总结

前言

在数据存储与检索的领域中,B 树和 B + 树凭借出色的性能表现,成为数据库索引、文件系统等场景的核心数据结构。它们通过独特的多叉树结构和节点设计,有效减少了磁盘 I/O 操作次数,极大提升了数据查询效率。本文将深入剖析 B 树和 B + 树的结构特点、操作原理、性能差异及实际应用场景,结合丰富的图示与代码示例,帮助读者全面掌握这两种重要的数据结构。

一、B 树的基本概念与结构特性

1.1 B 树的定义

B 树是一种自平衡的多路搜索树,它允许每个节点拥有多个子节点和多个关键字。B 树的设计目标是为了高效地存储和检索数据,尤其是在磁盘等存储设备上,通过减少磁盘 I/O 操作来提高数据访问效率。

1.2 B 树的结构特性

  1. 节点关键字数量限制:B 树对每个节点的关键字数量有严格限制。假设 B 树的阶数为 m m m m ≥ 2 m \geq 2 m2),除根节点外,每个非叶子节点至少包含 ⌈ m / 2 ⌉ − 1 \lceil m/2 \rceil - 1 m/21个关键字,最多包含 m − 1 m - 1 m1个关键字;根节点至少有 1 个关键字,最多有 m − 1 m - 1 m1个关键字。

  2. 子节点数量关系:每个节点的子节点数量等于其关键字数量加 1。例如,若一个节点有 n n n个关键字,那么它就有 n + 1 n + 1 n+1个子节点。

  3. 关键字有序性:节点内的关键字按升序排列,且左子树所有节点的关键字小于该节点的关键字,右子树所有节点的关键字大于该节点的关键字。这种有序性保证了 B 树的搜索效率。

  4. 树的平衡性:B 树通过插入和删除操作时的节点分裂与合并,保持树的平衡,确保从根节点到任意叶子节点的路径长度大致相同,从而避免树结构退化,保证操作的高效性。
    2

1.3 B 树的节点结构示例

以 C++ 代码定义 B 树节点结构如下:

// 定义B树节点结构
template <typename KeyType, int m>
struct BTreeNode {int n; // 节点中关键字的数量KeyType keys[m - 1]; // 存储关键字的数组BTreeNode* children[m]; // 存储子节点指针的数组bool leaf; // 标记是否为叶子节点BTreeNode() : n(0), leaf(true) {for (int i = 0; i < m; ++i) {children[i] = nullptr;}}
};

二、B 树的基本操作

2.1 查找操作

在 B 树中查找关键字时,从根节点开始,将待查找的关键字与节点内的关键字进行比较:

  1. 若找到相等的关键字,则查找成功。

  2. 若关键字小于节点内某个关键字,则进入对应的左子树继续查找。

  3. 若关键字大于节点内所有关键字,则进入最右侧的子树继续查找。

  4. 若遍历到叶子节点仍未找到,则查找失败。

2.2 插入操作

B 树的插入操作需要保证插入后树的结构特性。插入过程如下:

  1. 从根节点开始,找到合适的叶子节点插入关键字。

  2. 若插入后叶子节点的关键字数量未超过 m − 1 m - 1 m1,则插入完成。

  3. 若插入后叶子节点关键字数量达到 m m m,则进行节点分裂:将节点中间的关键字上移到父节点,该节点分裂为两个节点,分别包含原节点的前半部分和后半部分关键字与子节点。若父节点也满了,则递归地对父节点进行分裂操作,直至根节点。若根节点分裂,则树的高度增加 1。

2.3 删除操作

B 树的删除操作较为复杂,需根据不同情况进行处理:

  1. 若待删除关键字在叶子节点且节点内关键字数量大于等于 ⌈ m / 2 ⌉ \lceil m/2 \rceil m/2,直接删除该关键字。

  2. 若待删除关键字在叶子节点且节点内关键字数量等于 ⌈ m / 2 ⌉ − 1 \lceil m/2 \rceil - 1 m/21,需检查兄弟节点

    • 若兄弟节点关键字数量大于 ⌈ m / 2 ⌉ − 1 \lceil m/2 \rceil - 1 m/21,则从兄弟节点借一个关键字,并调整父节点的关键字。
    • 若兄弟节点关键字数量也等于 ⌈ m / 2 ⌉ − 1 \lceil m/2 \rceil - 1 m/21,则将兄弟节点与当前节点合并,并删除父节点中对应的关键字。若父节点因此关键字数量不足,则递归向上处理。
  3. 若待删除关键字在非叶子节点,可将其替换为该节点左子树的最大关键字或右子树的最小关键字,然后在相应子树中删除该关键字。

三、B + 树的基本概念与结构特性

3.1 B + 树的定义

B + 树是 B 树的一种变形,它进一步优化了数据查询性能,特别适用于范围查询和数据库索引。

3.2 B + 树的结构特性

  1. 关键字分布:所有关键字都存储在叶子节点,非叶子节点仅存储用于索引的关键字,这些关键字是其对应子树中关键字的最大值(或最小值)。

  2. 叶子节点链表:叶子节点通过指针连接成一个有序链表,方便进行范围查询。从第一个叶子节点开始,依次遍历链表,可获取所有数据。

  3. 节点关键字数量限制:与 B 树类似,B + 树对节点关键字数量也有要求。除根节点外,每个非叶子节点至少包含 ⌈ m / 2 ⌉ \lceil m/2 \rceil m/2个关键字,最多包含 m m m个关键字;根节点至少有 1 个关键字,最多有 m m m个关键字。叶子节点至少包含 ⌈ m / 2 ⌉ \lceil m/2 \rceil m/2个关键字,最多包含 m m m个关键字。

  4. 查询特性:在 B + 树中进行查询时,若查找的关键字在非叶子节点,查询会继续向下,直到叶子节点。这保证了任何查询都需要从根节点到叶子节点的相同路径长度,查询性能更加稳定。
    1

3.3 B + 树的节点结构示例

用 C++ 定义 B + 树节点结构如下:

// 定义B+树叶子节点结构
template <typename KeyType, int m>
struct BPlusTreeLeafNode {int n; // 节点中关键字的数量KeyType keys[m]; // 存储关键字的数组BPlusTreeLeafNode* next; // 指向下一个叶子节点的指针// 可添加指向数据记录的指针或其他相关数据BPlusTreeLeafNode() : n(0), next(nullptr) {}
};// 定义B+树非叶子节点结构
template <typename KeyType, int m>
struct BPlusTreeInternalNode {int n; // 节点中关键字的数量KeyType keys[m]; // 存储关键字的数组BPlusTreeInternalNode* children[m + 1]; // 存储子节点指针的数组BPlusTreeInternalNode() : n(0) {for (int i = 0; i < m + 1; ++i) {children[i] = nullptr;}}
};

四、B 树与 B + 树的对比

特性B 树B + 树
关键字存储位置非叶子节点和叶子节点都存储关键字仅叶子节点存储关键字,非叶子节点用于索引
范围查询性能需多次回溯,效率较低可通过叶子节点链表快速遍历,效率高
插入删除复杂度平均复杂度较低,极端情况可能导致较多调整平均复杂度与 B 树相近,但调整更有规律
磁盘 I/O 次数可能较多相对较少,因为叶子节点存储所有数据
适用场景适用于一般的文件系统和部分数据库索引更适合数据库索引,尤其是范围查询频繁的场景

五、B 树与 B + 树的应用场景

5.1 数据库索引

0

B + 树是数据库索引的主流选择。在关系型数据库中,B + 树索引能够快速定位数据记录,无论是等值查询还是范围查询,都能提供高效的性能。例如,在 SQL 查询语句SELECT * FROM users WHERE age BETWEEN 18 AND 30中,B + 树索引可以通过叶子节点链表快速找到满足条件的数据。

5.2 文件系统

B 树常用于文件系统的目录结构和元数据管理。通过 B 树的结构,文件系统可以快速查找文件和目录,并且在文件创建、删除和修改时,保持良好的性能和结构稳定性。

5.3 其他场景

在数据仓库、搜索引擎的倒排索引等场景中,B 树和 B + 树也有广泛应用,用于优化数据的存储和检索效率。

总结

B 树和 B + 树作为高效的数据结构,通过独特的设计在数据存储与检索领域发挥着重要作用。B 树凭借平衡的多叉树结构,在多种场景下提供稳定的性能;B + 树则针对范围查询进行优化,成为数据库索引的首选。理解它们的结构原理、操作特性和应用场景,对于开发高性能的存储系统、优化数据库查询等工作具有重要意义。

That’s all, thanks for reading!
图片均来自于网络, 感谢无私分享
觉得有用就点个赞、收进收藏夹吧!关注我,获取更多干货~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/81656.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用VCS+XA加密verilog和spice网表

如果要交付verilog&#xff0c;但是需要对方进行VCS仿真&#xff0c;那么可以用以下方法&#xff1a; 一、基于编译指令的局部加密​ ​适用场景​&#xff1a;需精确控制加密范围&#xff08;如仅加密核心算法或敏感逻辑&#xff09;。 ​实现步骤​&#xff1a; ​代码标注…

策略模式-枚举实现

策略模式的实现方法有很多&#xff0c;可以通过策略类if,else实现。下面是用枚举类实现策略模式的方法。 定义一个枚举类&#xff0c;枚举类有抽象方法&#xff0c;每个枚举都实现抽象方法。这个策略&#xff0c;实现方法是工具类的很实现&#xff0c;代码简单好理解 枚举实现…

大数据hadoop小文件处理方案

Hadoop处理小文件问题的解决方案可分为存储优化、处理优化和架构优化三个维度,以下是综合技术方案及实施要点: 一、存储层优化方案 1.文件合并技术 离线合并:使用hadoop fs -getmerge命令将多个小文件合并为大文件并重新上传; MapReduce合并:开发专用MR…

线程调度与单例模式:wait、notify与懒汉模式解析

一.wait 和 notify&#xff08;等待 和 通知&#xff09; 引入 wait notify 就是为了能够从应用层面&#xff0c;干预到多个不同线程代码的执行顺序&#xff0c;可以让后执行的线程主动放弃被调度的机会&#xff0c;等先执行的线程完成后通知放弃调度的线程重新执行。 自助取…

ros运行包,Ubuntu20.04成功运行LIO-SAM

zz:~/lio_sam_ws$ source devel/setup.bash zz:~/lio_sam_ws$ roslaunch lio_sam run.launch 创建包链接&#xff1a; 链接1&#xff1a;Ubuntu20.04成功运行LIO-SAM_ubuntu20.04运行liosam-CSDN博客 链接2&#xff1a;ubuntu 20.04 ROS 编译和运行 lio-sam,并且导出PCD文件…

AI自动化工作流:开启当下智能生产力的价值

举手之言&#xff1a;AI自动化工作流创造了什么呢&#xff1f; AI自动化工作流 &#xff0c;顾名思义&#xff0c;是将人工智能&#xff08;AI&#xff09;技术与自动化流程相结合&#xff0c;通过智能化的方式来完成复杂的任务和操作。简单来说&#xff0c;它就是利用AI的强大…

【设计模式】- 行为型模式2

观察者模式 定义了一对多的依赖关系&#xff0c;让多个观察者对象同时监听某一个对象主题。这个主题对象在状态变化时&#xff0c;会通知所有的观察者对象&#xff0c;让他们能够自动更新自己。 【主要角色】 抽象主题角色&#xff1a;把所有观察者对象保存在一个集合里&…

mapbox-gl强制请求需要accessToken的问题

vue引入"mapbox-gl": "^2.15.0", 1.13以后得版本&#xff0c;都强制需要验证这个mapboxgl.accessToken。 解决办法&#xff1a;实例化地图的代码中&#xff0c;加入这个&#xff1a; const originalFetch window.fetch; window.fetch function ({ url…

已知6、7、8月月平均气温和标准差,求夏季季平均温度与标准差

由下面定理&#xff0c;得出平方和的公式&#xff1a;&#xff08;即每天的温度平方和&#xff09; 这样就可以推出季平均的算法&#xff1a; 举例&#xff1a;在Excel用公式算&#xff0c;不要手算&#xff1a; 因此季平均&#xff1a;(B2*C2B3*C3B4*C4)/SUM(B2:B4) 季标准差…

手机内存不够,哪些文件可以删?

1️⃣应用缓存文件 安卓&#xff1a;通过「文件管理器」→「Android」→「data」或「cache」文件夹&#xff08;部分需权限&#xff09;&#xff0c;或直接在应用设置中清除缓存 iOS&#xff1a;无需手动清理&#xff0c;系统会自动管理&#xff0c;或在应用内设置中清除&…

可编辑98页PPT | 某大型制造业数字化转型战略规划项目方案

荐言摘要&#xff1a;某大型制造业数字化转型战略规划项目方案聚焦企业全价值链升级&#xff0c;以“数据驱动业务重塑”为核心&#xff0c;打造行业标杆级数字化能力。项目将分三阶段推进&#xff0c;首阶段聚焦顶层设计&#xff0c;通过现状诊断明确痛点&#xff1a;针对企业…

lovart design 设计类agent的系统提示词解读

文章目录 lovart 设计agent介绍角色定义工作规范工具调用任务复杂度指南任务移交指南其他ref lovart 设计agent介绍 lovart作为设计agent&#xff0c;产品功能包括&#xff1a; 全链路设计能力&#xff1a;可以快速生成完整的品牌视觉方案&#xff0c;包括标志、配色、品牌规范…

使用 docker-volume-backup 备份 Docker 卷

docker-volume-backup 是一个用于备份 Docker 卷的工具&#xff0c;在 Windows 10 上使用它&#xff0c;你可以按照以下步骤操作&#xff1a; 1. 确保 Docker 环境已安装并正常运行 在 Windows 10 上&#xff0c;你需要安装 Docker Desktop for Windows。可以从 Docker 官方网…

用户行为日志分析的常用架构

## 1. 经典Lambda架构 Lambda架构是一种流行的大数据处理架构&#xff0c;特别适合用户行为日志分析场景。 ### 1.1 架构组成 Lambda架构包含三层&#xff1a; - **批处理层(Batch Layer)**: 存储全量数据并进行离线批处理 - **实时处理层(Speed Layer)**: 处理最新数据&…

从API到UI:直播美颜SDK中的滤镜与贴纸功能开发与落地方案详解

时下&#xff0c;滤镜和贴纸功能&#xff0c;已经成为主播们展现个性、增强互动的“必备神器”。那么&#xff0c;这些功能背后的技术实现到底有多复杂&#xff1f;如何从API到UI构建一个流畅、灵活的美颜SDK呢&#xff1f;本文将从底层原理到前端实现&#xff0c;全面解析这两…

21.EC实战 嵌入式控制器EC如何进入休眠模式实现低功耗

文章目录 一、概述1. WUI0中断向量表配置2. 中断服务函数内容3. 深度睡眠检测4. 深度睡眠功能函数4.1 关闭所有中断4.2 外部中断对应引脚功能配置4.3 设置唤醒功能和唤醒中断4.4 进入深度睡眠状态一、概述 EC作为笔记本电脑的嵌入式控制器,在笔记本电脑使用电池单独工作时,关…

Java实现PDF加水印功能:技术解析与实践指南

Java实现PDF加水印功能&#xff1a;技术解析与实践指南 在当今数字化办公环境中&#xff0c;PDF文件因其跨平台兼容性和格式稳定性而被广泛应用。然而&#xff0c;为了保护文档的版权、标记文档状态&#xff08;如“草稿”“机密”等&#xff09;或增加文档的可追溯性&#xf…

vue2、vue3项目打包生成txt文件-自动记录打包日期:git版本、当前分支、提交人姓名、提交日期、提交描述等信息 和 前端项目的版本号json文件

vue2 打包生成text文件 和 前端项目的版本号json文件 项目打包生成txt文件-自动记录git版本、当前分支、提交人姓名、提交日期、提交描述等信息生成版本号json文件-自动记录当前版本号、打包时间等信息新建branch-version-webpack-plugin.js文件 // 同步子进程 const execSyn…

Filament引擎(一) ——渲染框架设计

filament是谷歌开源的一个基于物理渲染(PBR)的轻量级、高性能的实时渲染框架&#xff0c;其框架架构设计并不复杂&#xff0c;后端RHI的设计也比较简单。重点其实在于项目中材质、光照模型背后的方程式和理论&#xff0c;以及对它们的实现。相关的信息&#xff0c;可以参考官方…

洛谷B3876—— [信息与未来 2015] 中间值

见&#xff1a;B3876 [信息与未来 2015] 中间值 - 洛谷 题目描述 给出一个正整数 n&#xff0c;生成长度为 n 的数列 a&#xff0c;其中 ai​i(1≤i≤n)。 若 n 为奇数&#xff0c;则输出 a 的中间数&#xff08;位于 a 正中位置的数&#xff09;&#xff1b;若 n 为偶数&am…