MYSQL - Mysql索引和redis跳表
疑问
- mysql 索引如何实现
- mysql 索引结构B+树与hash有何区别。分别适用于什么场景
- 数据库的索引还能有其他实现吗
- redis跳表是如何实现的
- 跳表和B+树,LSM树有和区别呢
解析
当你站在这个角度去思考问题时,还会不知道B+树索引和hash索引的区别吗
数据集合的查找问题
- 需要支持哪些查找方式,单key/多key/范围查找,
- 插入/删除效率
- 查找效率(即时间复杂度)
- 存储大小(空间复杂度)
常用的查找结构
hash hash是key,value形式,通过一个散列函数,能够根据key快速找到value B+树 B+树是在平衡二叉树基础上演变过来,为什么我们在算法课上没学到B+树和跳表这种结构呢。因为他们都是从工程实践中得到,在理论的基础上进行了妥协。
B+树首先是有序结构,为了不至于树的高度太高,影响查找效率,在叶子节点上存储的不是单个数据,而是一页数据,提高了查找效率,而为了更好的支持范围查询,B+树在叶子节点冗余了非叶子节点数据,为了支持翻页,叶子节点之间通过指针连接。 跳表 跳表是在链表的基础上进行扩展的,为的是实现redis的sorted set数据结构。 level0: 是存储原始数据的,是一个有序链表,每个节点都在链上 level0+: 通过指针串联起节点,是原始数据的一个子集,level等级越高,串联的数据越少,这样可以显著提高查找效率
总结
联合索引 复合索引(abc)如何索引命中规则
CREATE TABLE `test_models` ( `id` INT(11) NOT NULL AUTO_INCREMENT, `a` INT(11) DEFAULT NULL, `b` INT(11) DEFAULT NULL, `c` INT(11) DEFAULT NULL, `d` INT(11) DEFAULT NULL, `e` INT(11) DEFAULT NULL, PRIMARY KEY (`id`), KEY `index_abc` (`a`,`b`,`c`) );
EXPLAIN SELECT * FROM test_models WHERE a = 100 AND b = 1000 AND c = 10000;
结论: AND AND 只要用到了最左侧a列,和顺序无关 都会使用 索引
a = 1 AND b = 2 AND c = 3 ; 使用索引 c = 1 AND b = 2 AND a = 3 ; 使用索引 a = 1 AND b = 2 ; 使用索引 a = 1 AND c = 3 ; 使用索引 c = 1 AND a = 2 ; 使用索引
不包含最左侧的 a 的不使用索引
c = 3 ; 未使用索引 b = 2 ; 未使用索引 b = 2 AND c = 3 ; 未使用索引 c = 1 AND b = 2 ; 未使用索引
OR 不使用索引
a = 1 AND b = 2 OR c = 3 未使用索引 a = 1 OR b = 2 AND c = 3 未使用索引 a = 1 OR b = 2 OR c = 3 未使用索引
最左侧的‘a’列 被大于,小于,不等于比较的 ,不使用索引
a > 1 AND b = 2 AND c = 3 未使用索引 a < 1 AND b = 2 AND c = 3 未使用索引 a > 1 ; 未使用索引 a <> 1 AND b = 2 AND c = 3 未使用索引
最左侧a=某某,后面列大于小于无所谓,都使用索引(但后面必须 and and )
a = 1 AND b < 2 AND c = 3 使用索引 a = 1 AND c = 2 AND b < 3 使用索引 a = 1 AND b < 2 使用索引 a = 1 AND b <> 2 AND c = 3 使用索引 // 可以说 OR一出现就不使用 a = 1 AND b < 2 OR c = 2 未使用索引
ORDER BY a = 某,后面order 无所谓 都 使用索引 (和最上面的最左匹配一样) 看
a = 1 AND b = 2 AND c = 3 ORDER BY a;// 或者 ORDER BY b , ORDER BY c ,ORDER BY d, 使用索引 a = 1 ORDER BY a; // 或者 ORDER BY b,ORDER BY c,ORDER BY d 使用abc索引
b = 某,不使用
b = 1 ORDER BY a; //ORDER BY b 都 未使用索引
ORDER BY 似乎没有任何影响,去掉 ORDER BY 确实和上面的测试重复