当前位置：首页 > Python > 正文

深入理解B树与B+树（Python语言实现与应用场景对比）

主机测评网
Python
2025-12-04
326

在数据库系统和文件系统中，B树和B+树是两种非常重要的数据结构。它们被广泛用于高效地存储和检索大量数据。本文将用通俗易懂的方式，结合Python语言的代码示例，帮助你理解这两种树的结构、区别以及各自适用的场景。

什么是B树？

B树（Balanced Tree）是一种自平衡的多路搜索树。它的每个节点可以包含多个键（keys）和多个子节点（children），从而减少树的高度，提升磁盘I/O效率——这在处理大规模数据时尤为重要。

B树的关键特性包括：

所有叶子节点位于同一层；
每个内部节点的子节点数量介于 ⌈m/2⌉ 到 m 之间（m为阶数）；
键值按升序排列，且每个键将子树划分为左右两部分。

什么是B+树？

B+树是B树的一种变体，它在数据库索引（如MySQL的InnoDB引擎）中应用极为广泛。B+树的主要特点是：

所有数据都存储在叶子节点中，内部节点仅用于索引；
叶子节点通过指针连接成一个有序链表，便于范围查询；
内部节点可容纳更多键，进一步降低树高。

深入理解B树与B+树（Python语言实现与应用场景对比） B树 B+树 Python数据结构数据库索引第1张

B树 vs B+树：核心区别

特性	B树	B+树
数据存储位置	所有节点均可存数据	仅叶子节点存数据
范围查询效率	较低（需中序遍历）	高（叶子节点链表）
树高度	相对较高	更低（因内部节点不存数据）

Python简易实现示例

下面是一个简化版的B+树插入逻辑（完整实现较复杂，此处仅展示核心思想）：

class BPlusTreeNode:    def __init__(self, leaf=False):        self.leaf = leaf        self.keys = []        self.children = []        self.next = None  # 用于连接叶子节点class BPlusTree:    def __init__(self, degree):        self.root = BPlusTreeNode(leaf=True)        self.degree = degree  # 阶数    def insert(self, key):        root = self.root        if len(root.keys) == (2 * self.degree) - 1:            # 根节点已满，需要分裂            new_root = BPlusTreeNode()            self.root = new_root            new_root.children.append(root)            self._split_child(new_root, 0)            self._insert_non_full(new_root, key)        else:            self._insert_non_full(root, key)    def _insert_non_full(self, node, key):        i = len(node.keys) - 1        if node.leaf:            node.keys.append(None)            while i >= 0 and key < node.keys[i]:                node.keys[i + 1] = node.keys[i]                i -= 1            node.keys[i + 1] = key        else:            while i >= 0 and key < node.keys[i]:                i -= 1            i += 1            if len(node.children[i].keys) == (2 * self.degree) - 1:                self._split_child(node, i)                if key > node.keys[i]:                    i += 1            self._insert_non_full(node.children[i], key)    def _split_child(self, parent, index):        degree = self.degree        child = parent.children[index]        new_child = BPlusTreeNode(leaf=child.leaf)        parent.keys.insert(index, child.keys[degree - 1])        parent.children.insert(index + 1, new_child)        new_child.keys = child.keys[degree:]        child.keys = child.keys[:degree - 1]        if not child.leaf:            new_child.children = child.children[degree:]            child.children = child.children[:degree]        else:            # 连接叶子节点            new_child.next = child.next            child.next = new_child

注意：上述代码仅为教学目的，未处理边界情况和完整删除逻辑。实际工程中建议使用成熟的库（如 sortedcontainers 或数据库引擎）。