数据库索引和索引底层实现原理
索引的概念和优点
概念: 索引存储在内存中,为服务器存储引擎为了快速找到记录的一种数据结构。索引的主要 作用是加快数据查找速度,提高数据库的性能。 优点: (1) 创建唯一性索引,保证数据库表中每一行数据的唯一性 (2) 大大加快数据的检索速度,这也是创建索引的最主要的原因 (3) 加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。 (4) 在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间
索引的分类
(1) 普通索引:最基本的索引,它没有任何限制。
(2) 唯一索引:与普通索引类似,不同的就是索引列的值必须唯一,但允许有 空值。如果是组合索引,则列值的组合必须唯一。 (3) 主键索引:它是一种特殊的唯一索引,用于唯一标识数据表中的某一条记 录,不允许有空值,一般用 primary key 来约束。 (4) 联合索引(又叫复合索引):多个字段上建立的索引,能够加速复合查询 条件的检索。 (5) 全文索引:老版本 MySQL 自带的全文索引只能用于数据库引擎为 MyISAM 的数据表,新版本 MySQL 5.6 的 InnoDB 支持全文索引。默认 MySQL 不支持中文全文检索,可以通过扩展 MySQL,添加中文全文检索或为中文内容表提供 一个对应的英文索引表的方式来支持中文。
索引的底层实现原理
1. 索引结构
索引是在 Mysql 的存储引擎(InnoDB,MyISAM)层中实现的, 而不是在服务层实现 的. 所以每种存储引擎的索引都不一定完全相同, 也不是所有的存储引擎都支持所有的索引 类型的, Mysql 目前提供了以下 4 种索引: B+Tree 索引: 最常见的索引类型, 大部分索引都支持 B+树索引. Hash 索引: 只有 Memory 引擎支持, 使用场景简单. R-Tree 索引(空间索引): 空间索引是 MyISAM 引擎的一个特殊索引类型, 主要地理 空间数据, 使用也很少. S-Full-text(全文索引): 全文索引也是 MyISAM 的一个特殊索引类型, 主要用于全 文索引, InnoDB 从 Mysql5.6
2. BTree 结构
B+Tree 是在 BTree 基础上进行演变的, 所以我们先来看看 BTree, BTree 又叫多路
平衡搜索树, 一颗 m 叉 BTree 特性如下
(1) 树中每个节点最多包含 m 个孩子.
(2) 除根节点与叶子节点外, 每个节点至少有[ceil(m/2)] 个孩子(ceil 函数指向上取整).
(3) 若根节点不是叶子节点, 则至少有两个孩子.
(4) 每个非叶子节点由 n 个 Key 和 n+1 个指针组成, 其中 [ceil(m/2) -1 ] <= n <= m-1. 以 5 叉 BTree 为例, key 的数量: 公式推导 [ceil(m/2) -1 ] <= n <= m-1. 所以 2 <= n <= 4, 中间节点分裂父节点,两边节点分裂
3.B+Tree 结构
B+Tree 为 BTree 的变种, B+Tree 与 BTree 的区别:
1.B+Tree 的叶子节点保存所有的 key 信息, 依 key 大小顺序排列.
2.B+Tree 叶子节点元素维护了一个单项链表. 所有的非叶子节点都可以看作是 key 的索引部分
B+Tree 查询效率更稳定. Mysql 中的 B+Tree
MySql 索引数据结构对经典的 B+Tree 进行了优化, 在原 B+Tree 的基础上, 增加
了一个指向相邻叶子节点的链表指针, 就形成了带有顺序指针的 B+Tree, 提高区间访问的
性能