解析MySQL索引的作用

Viridis ·

更新时间:2024-11-10

· 1277 次阅读

1、索引用于减少需要扫描的记录数量

2、索引用于排序

1、分析下面的查询语句：

2、使用联合索引进行排序时的注意事项

3、不可以使用索引进行排序的情况：

3、索引用于分组

总结

面试题：索引的作用？

首先建立一张数据库表：

create table single_table(
id int not auto_increment, 
key1 varchar(100),         
key2 int,
key3 varchar(100),
key_part1 varchar(100),
key_part2 varchar(100),
key_part3 varchar(100),
    common_field varchar(100),
primary key(id),          # 聚簇索引
key idx_key1(key1),       # 二级索引
unique key uk_key2(key2), # 二级索引，而且该索引是唯一二级索引
key idx_key3(key3),       # 二级索引
key idx_key_part(key_part1,key_part2,key_part3) # 二级索引，也是联合索引
)Engine=InnoDB CHARSET=utf8;

1、索引用于减少需要扫描的记录数量

对于某个查询来说，最简单粗暴的执行方案就是扫描表中的所有记录，判断每一条搜索记录是否符合搜索条件。如果符合，就将其发送到客户端，否则就跳过该记录。这种执行方案被称为全表扫描。

对于InnoDB存储引擎来说，全表扫描意味着从聚簇索引第一个叶子节点的第一条记录开始，沿着记录所在的单向链表向后扫描，直到最后一个叶子节点的最后一条记录，如果可以利用B+树查找索引列值等于某个值的记录，这样就可以减少需要扫描的记录的数量。

由于B+树叶子节点中的记录是按照索引列值有小到大的顺序排序的，所以只需要扫描某个区间或者某些区间中的记录也可以明显减少需要扫描的记录的数量。

对于查询语句：

select * from single_table where id>=2 and id<=100;

这个语句其实就是想查找id值在[2,100]区间中的所有聚簇索引记录，我们可以通过聚簇索引对应的B+树快速的找到id=2的那条聚簇索引记录，然后沿着记录所在的单向链表向后扫描，直到某条聚簇索引记录的id值不在[2,100]区间中为止，与扫描全部的聚簇索引记录相比，这种方式大大减少了需要扫描的记录数量，所以提升了查询效率。

其实，对于B+树来说，只要索引列和常数使用=、<=>、in、not in、is null、is not null、>、<、>=、<=、between、!=、或者like操作符连接起来，就可以产生扫描区间，从而提高查询效率。

2、索引用于排序

我们在编写查询语句时，经常需要使用order by子句对查询出来的记录按照某种规则进行排序。在一般情况下，我们只能把记录加载到内存中，然后再用一些排序算法在内存中对这些记录进行排序。有时查询的结果集可能太大以至于在内存中无法进行排序，此时就需要暂时借助磁盘的空间来存放中间结果，在排序操作完成后再把排序的结果返回给客户端。

在MySQL中，这种在内存中或者磁盘中进行排序的方式称为文件排序，但是如果order by子句中使用了索引列，就有可能省去在内存或磁盘中排序的步骤。

1、分析下面的查询语句：

select * form single_table order by key_part1,key_part2,key_part3 limit 10;

这个查询语句的结果集需要先按照key_part1值排序，如果记录的key_part1值相同，再按照key_part2值排序，如果key_part1值和key_part2值都相同，再按照key_part3排序。而我们建立的联合索引idx_key_part就是按照上面的规则排序的，如下为idx_key_part索引的简化示意图：

所以我们可以从第一条idx_key_part二级索引记录开始，沿着记录所在的单向链表向后扫描，取10条二级索引记录即可。由于我们的查询列表是*，也就是需要读取完整的用户记录，所以针对获取到的每一条二级索引记录都执行一次回表操作，将完整的用户记录发送给客户端。这样就省去了给10000条记录排序的时间。

这里我们在执行查询语句时加了limit语句，如果不限制需要获取的记录数量，会导致为大量二级索引记录执行回表操作，这样会影响整体的性能。

2、使用联合索引进行排序时的注意事项

在使用联合索引时，需要注意：order by子句后面的列的顺序也必须按照索引列的顺序给出；如果给出order by key_part3,key_part2,key_part1的顺序，则无法使用B+树索引。

之所以颠倒排序列顺序就不能使用索引，原因还是联合索引中页面和记录的排序规则是规定的，即先按照key_part1值排序，如果记录的key_part1值相同，再按照key_part2值排序，如果记录的key_part1值和key_part2值都相同，再按照key_part3值排序。如果order by子句的内容是order by key_part3,key_part2,key_part1，那就要求先按照key_part3值排序，如果记录的key_part3值相同，再按照key_part2值排序，如果记录的key_part3值和key_part2值都相同，再按照key_part1值排序，这显然是冲突的。