索引页是哪一页,索引表是目录吗

2022年11月16日 09:26 • 综合

前言

由于 MySQL 是作为存储层部署在业务系统的最后端，所有的业务数据最终都要入库落盘，但随着一个项目在线上运行的时间越来越久，数据库中的数据量自然会越来越多，而数据体积出现增长后，当需要从表查询一些数据时，效率会越发低下。在正常情况下，表的查询性能和数据量是成反比的，也就是数据越多，查询越慢。

这是什么原因导致的呢？由于 MySQL 默认的查询方式导致的，举个例子~

SELECT * FROM `zz_student`;+————+——–+——+——–+| student_id | name | sex | height |+————+——–+——+——–+| 1 | 竹子 | 男 | 185cm || 2 | 熊猫 | 女 | 170cm || 3 | 子竹 | 男 | 182cm || 4 | 棕熊 | 男 | 187cm || 5 | 黑豹 | 男 | 177cm || 6 | 脑斧 | 男 | 178cm || 7 | 兔纸 | 女 | 165cm |+————+——–+——+——–+SELECT * FROM `zz_student` WHERE name = "脑斧";复制代码

上面给出了一张学生表，其中有七位学生信息，而此时要查询姓名为「脑斧」的学生信息时， MySQL 底层是如何检索数据的呢？会触发磁盘 IO ，对表中的数据进行逐条读取并判断，也就是说，在这里想要查找到符合要求的数据，至少要经过六次磁盘 IO 才能检索到目标（暂且先不考虑局部性读取原理与随机 IO ）。

那假设这个表中有 1000W 条数据呢？要查的目标数据位于表的 900W 行以后怎么办？岂不是要触发几百万次磁盘 IO 才能检索到数据啊，如果真的这样去干，其效率大家可想而知。

在这种情况下，又该如何去提升数据库的查询性能呢？因为查询往往都是一个业务系统中最频繁的操作，一般项目的写/读请求比例都遵循三七定律，也就是 30% 的请求会涉及到写库操作，另外 70% 则属于查库类型的操作。

在思考如何提升查询性能前，咱们不妨先回想一下小时候的场景，小时候由于刚接触汉字，很多字都不认识，所以通常每个人小时候都会拥有一本「新华字典」，但一本字典那么厚，我们是一页页去翻的吗？并不是，字典中有目录索引，我们可以根据音节、偏旁等方式查找不认识的字。

在「新华字典」中一页页翻找某个汉字，就类似于我们前面给出的全表扫描方式，效率特别特别低，而通过目录索引则能够在很短的时间内找到目标汉字。

既然字典中都存在目录索引页，能帮助小时候的我们快速检索汉字，那这个思想能否应用到数据库中来呢？答案是当然可以，并且 MySQL 也提供了索引机制，索引是数据库中的核心组件之一，一张表中建立了合适的索引后，往往在面对海量数据查询时，能够事半功倍，接下来一起聊一聊 MySQL 的索引。

索引机制会分为上、中、下三篇进行阐述，大致内容如下：

《上篇：索引初识篇》主要讲解索引的概述、分类、使用与管理等；

《中篇：索引应用篇》主要阐述索引优劣分析、建立索引的原则、索引失效的场景、如何正确地使用索引、索引优化机制等；

《下篇：索引原理篇》则主要讲述索引的底层实现、 B+Tree、Hash 数据结构、聚簇索引和非聚簇索引实现、索引查询原理、索引管理实现等；

一、MySQL索引机制概述

对于 MySQL 索引机制的作用，经过上述「新华字典」的案例后可得知：索引就是用来帮助表快速检索目标数据的。此时先来简单回顾一下 MySQL 中索引是如何使用的呢？首先需要创建索引， MySQL 可以通过 CREATE、ALTER、DML 三种方式创建一个索引。

1.1、MySQL索引的创建方式①使用 CREATE 语句创建CREATE INDEX indexName ON tableName (columnName(length) [ASC|DESC]);复制代码

这种创建方式可以给一张已存在的表结构添加索引，其中需要指定几个值：

indexName ：当前创建的索引，创建成功后叫啥名字。tableName ：要在哪张表上创建一个索引，这里指定表名。columnName ：要为表中的哪个字段创建索引，这里指定字段名。length ：如果字段存储的值过长，选用值得前多少个字符创建索引。ASC|DESC ：指定索引的排序方式， ASC 是升序， DESC 是降序，默认 ASC 。

当然，上述语句中的 INDEX 也可更改为 KEY ，作用都是创建一个普通索引，而对于其他的索引类型，这点在后续的索引分类中再聊。

②使用 ALTER 语句创建ALTER TABLE tableName ADD INDEX indexName(columnName(length) [ASC|DESC]);复制代码

这里的参数都相同，所以不再重复赘述。

③建表时 DML 语句中创建CREATE TABLE tableName( columnName1 INT(8) NOT NULL, columnName2 …., ….., INDEX [indexName] (columnName(length)) );复制代码

这种方式就比较适合在库表设计时，已经确定了索引项的情况下建立。

1.2、查询、删除、指定索引

但不管通过哪种方式建立索引，本质上创建的索引都是相同的，当索引创建完成后，可通过 SHOW INDEX FROM tableName; 这条命令查询一个表中拥有的索引，如下：

CREATE TABLE `zz_user` ( `user_id` int(8) NOT NULL AUTO_INCREMENT, `user_name` varchar(255) NULL DEFAULT "", `user_sex` varchar(255) NULL DEFAULT "", `user_phone` varchar(255) NULL DEFAULT "", PRIMARY KEY (`user_id`) USING BTREE) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact;复制代码

在上述的建表 SQL 中，为 user_id 创建了一个主键索引，然后来查一下当前表的索引信息：

简单地概述一下查询后，每个字段的含义：

① Table ：当前索引属于那张表。② Non_unique ：目前索引是否属于唯一索引， 0 代表是的， 1 代表不是。③ Key_name ：当前索引的名字。④ Seq_in_index ：如果当前是联合索引，目前字段在联合索引中排第几个。⑤ Column_name ：当前索引是位于哪个字段上建立的。⑥ Collation ：字段值以什么方式存储在索引中， A 表示有序存储， NULL 表无序。⑦ Cardinality ：当前索引的散列程度，也就是索引中存储了多少个不同的值。⑧ Sub_part ：当前索引使用了字段值的多少个字符建立， NULL 表示全部。⑨ Packed ：表示索引在存储字段值时，以什么方式压缩， NULL 表示未压缩，⑩ Null ：当前作为索引字段的值中，是否存在 NULL 值， YES 表示存在。⑪ Index_type ：当前索引的结构（ BTREE, FULLTEXT, HASH, RTREE ）。⑫ Comment ：创建索引时，是否对索引有备注信息。

这条命令在后续排除问题、性能调优时，会有不小的作用，比如可以通过分析其中的 Cardinality 字段值，如果该值少于数据的实际行数，那目前索引有可能失效（对于这些后续排查篇和 SQL 优化篇再聊）。

OK~，到这里了解了一下索引相关的创建、查询命令，接着再看看删除、强制使用命令。

在 MySQL 中并未提供修改索引的命令，也就说当你建错了索引，只能先删再重新建立一次，删除索引的语句如下：

DROP INDEX indexName ON tableName;复制代码

当然，当建立了一条索引后，也可以强制性的为 SELECT 语句指定索引，如下：

SELECT * FROM table_name FORCE INDEX(index_name) WHERE …..;复制代码

FORCE INDEX 关键字可以为一条查询语句强制指定走哪个索引查询，但要牢记的是：如果当前的查询 SQL 压根不会走指定的索引字段，哪这种方式是行不通的，这个关键字的用法是：一条查询语句在有多个索引可以检索数据时，显式指定一个索引，减少优化器选择索引的耗时。

但要注意：如果你对于你整个业务系统十分熟悉，那可以这样干。但如果不熟悉的话，还是交给优化器来自行选择，否则会适得其反！

1.3、数据库索引的本质

前面一直在聊创建、查看、删除、指定等一些索引的基本操作，但索引本质上在数据库中是什么呢？大家都知道，数据库是基于磁盘工作的，所有的数据都会放到磁盘上存储，而索引也是数据的一种，因此与表数据相同，最终创建出的索引也会在磁盘生成本地文件。

不过索引文件在磁盘中究竟以何种方式存储，这是由索引的数据结构来决定的。同时，由于索引机制最终是由存储引擎实现，因此不同存储引擎下的索引文件，其保存在本地的格式也并不相同。

在这里有一个点需要注意：建立索引的工作在表数据越少时越好，如果你想要给一张百万、千万条数据级别的表新创建一个索引，那创建的耗时也不短，这是为什么呢？

因为刚刚聊过，索引本质上和表是一样的，都是磁盘中的文件，那也就代表着创建一个索引，并不像单纯的给一张表加个约束那么简单，而是会基于原有的表数据，重新在磁盘中创建新的本地索引文件。假设表中有一千万条数据，那创建索引时，就需要将索引字段上的 1000W 个值全部拷贝到本地索引文件中，同时做好排序并与表数据产生映射关系。

OK~，至此就对 MySQL 提供的索引机制做了简单回顾，下面再来说说数据库中“多样化”的索引类型。

二、MySQL的索引分类

在前面我为什么用多样化去形容数据库索引呢？因为确实如此，先列一些大家都听说过的索引称呼：聚簇索引、非聚簇索引、唯一索引、主键索引、联合索引、全文索引、单列索引、多列索引、复合索引、普通索引、二级索引、辅助索引、次级索引、有序索引、 B+Tree 索引、 R-Tree 索引、 T-Tree 索引、 Hash 索引、空间索引、前缀索引……

是不是看的眼花缭乱，这些都是 MySQL 中索引的一些称呼，一通看下来，估计大家看“索引”两个字都有点不认识了 ^_^

但实际上 MySQL 中真的有这么多索引类型吗？其实并没有，上述列出的索引称呼中，有几个称呼对应的索引是同一个，有一部分只是逻辑上的索引，那索引究竟该如何分类呢？其实从不同的层面上来说，可以将索引划分为不同的类型，接下来重点聊一聊。

2.1、数据结构层次

前面聊索引本质的时候提到过，索引建立后也会在磁盘生成索引文件，那每个具体的索引节点该如何在本地文件中存放呢？这点是由索引的数据结构来决定的。比如索引的底层结构是数组，那所有的索引节点都会以 Node1→Node2→Node3→Node4…. 这样的形式，存储在磁盘同一块物理空间中，不过 MySQL 的索引不支持数组结构，或者说数组结构不适合作为索引结构， MySQL 索引支持的数据结构如下：

B+Tree 类型： MySQL 中最常用的索引结构，大部分引擎支持，有序。Hash 类型：大部分存储引擎都支持，字段值不重复的情况下查询最快，无序。R-Tree 类型： MyISAM 引擎支持，也就是空间索引的默认结构类型。T-Tree 类型： NDB-Cluster 引擎支持，主要用于 MySQL-Cluster 服务中。

在上述的几种索引结构中， B+ 树和哈希索引是最常见的索引结构，几乎大部分存储引擎都实现了，对于后续两种索引结构在某些情况下也较为常见，但除开列出的几种索引结构外， MySQL 索引支持的数据结构还有 R+、R*、QR、SS、X 树等结构。

但为何后续的一些索引结构大家没听说过呢？这是因为索引到底支持什么数据结构，这是由存储引擎决定的，不同的存储引擎支持的索引结构也并不同，目前较为常用的引擎就是 MyISAM、InnoDB ，因此大家未曾听说后面列出的这些索引结构也是正常的。

当然，也正因为索引结构由存储引擎决定，而 MySQL 引擎层在《MySQL架构篇》中提到过，属于可拔插式引擎，所以如果你有能力自己实现一个引擎，那你甚至可以让引擎的索引机制支持任何数据结构。

在 MySQL 中创建索引时，其默认的数据结构就为 B+Tree ，如何更换索引的数据结构呢？如下：

CREATE INDEX indexName ON tableName (columnName(length) [ASC|DESC]) USING HASH;复制代码

也就是在创建索引时，通过 USING 关键字显示指定索引的数据结构（必须要为当前引擎支持的结构）。

同时索引会被分为有序索引和无序索引，这是指索引文件中存储索引节点时，会不会按照字段值去排序。那一个索引到底是有序还是无序，就是依据数据结构决定的，例如 B+Tree、R-Tree 等树结构都是有序，而哈希结构则是无序的。

2.2、字段数量层次

前面从索引的数据结构层次出发，可以将索引分为不同结构的类型，而从表字段的层次来看，索引又可以分为单列索引和多列索引，这两个称呼也比较好理解，单列索引是指索引是基于一个字段建立的，多列索引则是指由多个字段组合建立的索引。

单列索引也会分为很多类型，比如：

KEY、INDEX

多列索引的概念前面解释过了，不过它也有很多种叫法，例如：

组合索引、联合索引、复合索引、多值索引….

但不管名称咋变，描述的含义都是相同的，即由多个字段组合建立的索引。

不过在使用多列索引时要注意：当建立多列索引后，一条 SELECT 语句，只有当查询条件中了包含了多列索引的第一个字段时，才能使用多列索引，下面举个栗子。

比如在用户表中，通过 id、name、age 三个字段建立一个多列索引，什么情况下会使用索引，什么时候不会呢？如下：

— 无法使用多列索引的SQL语句SELECT * FROM `zz_user` WHERE name = "竹子" AND age = "18";– 能命中多列索引的SQL语句SELECT * FROM `zz_user` WHERE name = "竹子" AND id = 6;复制代码

OK，到这里就根据字段数量的层面出发，简单讲明了单列和多列索引的概念，但无论是单列还是多列，都可以存在一个前缀索引的概念，啥叫前缀索引呢？还记得创建索引时指定的 length 字段吗？

length ：如果字段存储的值过长，选用值的前多少个字符创建索引。

使用一个字段值中的前 N 个字符创建出的索引，就可以被称为前缀索引，前缀索引能够在很大程度上，节省索引文件的存储空间，也能很大程度上提升索引的性能，这是为什么呢？后面分析索引实现原理的时候细聊。

2.3、功能逻辑层次

相信大家在面试时，如果问到了 MySQL 索引机制，相信一定会问如下这道面试题：

请回答一下你知道的 MySQL 索引类型。

这题的答案该怎么回答呢？其实主要就是指 MySQL 索引从逻辑上可以分为那些类型，以功能逻辑划分索引类型，这也是最常见的划分方式，从这个维度来看主要可划分为五种：

普通索引、唯一索引、主键索引、全文索引、空间索引

对于普通索引、唯一索引、主键索引都介绍过了，就不再过多阐述，但稍微提一嘴，在主键字段上建立的索引被称为主键索引，非主键字段上建立的索引一般被称为辅助索引或、二级索引或次级索引，接着重点聊一下全文索引和空间索引。

全文索引和空间索引都是 MySQL5.7 版本后开始支持的索引类型，不过这两种索引都只有 MyISAM 引擎支持，其他引擎要么我没用过，要么就由于自身实现的原因不支持，例如 InnoDB 。对于全文索引而言，其实在 MySQL5.6 版本中就有了，但当时并不支持汉字检索，到了 5.7.6 版本的时候才内嵌 ngram 全文解析器，才支持亚洲语种的分词，同时 InnoDB 引擎也开始支持全文索引，在 5.7 版本之前，只有 MyISAM 引擎支持。

全文索引

全文索引类似于 ES、Solr 搜索中间件中的分词器，或者说和之前常用的 like+% 模糊查询很类似，它只能创建在 CHAR、VARCHAR、TEXT 等这些文本类型字段上，而且使用全文索引查询时，条件字符数量必须大于 3 才生效。当然，还是举个栗子才有感觉：

+————+——————————————–+——————+| article_id | article_name | special_column |+————+——————————————–+——————+| 1 | MySQL架构篇：自顶向下深入剖析MySQL整体架构 | 《全解MySQL》 || 2 | MySQL执行篇：一条SQL语句从诞生至结束的历程 | 《全解MySQL》 || 3 | MySQL设计篇：数据库六范式与反范式设计准则！| 《全解MySQL》 || 4 | MySQL索引篇：索引概述、分类及建立索引的原则| 《全解MySQL》 |+————+——————————————–+——————+复制代码

比如现在用户想要搜索一篇文章，但是忘记文章全称了，只记得「诞生至结束」这个词汇，此时用户搜索这个词汇，走全文索引的情况下，照样能够定位到上表中的第二条记录。

当然，全文索引如何创建与使用，待会儿后面一起列出来。

空间索引

空间索引这玩意儿其实用的不多，至少大部分项目的业务中不会用到，想要弄清楚空间索引，那么首先得知道一个概念： GIS 空间数据， GIS 是什么意思呢？是地理信息系统，这是一门新的学科，基于了计算机、信息学、地理学等多科构建的，主要就是用于管理地理信息的数据结构，在国土、规划、出行、配送、地图等和地理有关的项目中，应用较为频繁。

地理空间数据主要包含矢量数据、3D模型、影像文件、坐标数据等，说简单点，空间数据也就是可以将地理信息以模型的方式，在地图上标注出来。在 MySQL 中总共支持 GEOMETRY、POINT、LINESTRING、POLYGON 四种空间数据类型，而空间索引则是基于这些类型的字段建立的，也就是可以帮助我们快捷检索空间数据。

不过对于空间索引，一般用的较少，大家了解即可。

2.4、存储方式层次

上面聊完了三种不同层次的索引划分后，接着从存储方式的层面再聊聊，从存储方式来看， MySQL 的索引主要可分为两大类：

聚簇索引：也被称为聚集索引、簇类索引非聚簇索引：也叫非聚集索引、非簇类索引、二级索引、辅助索引、次级索引

重点说一说这两类索引存储方式的区别，在说之前先回忆一下数组和链表的区别：

数组是物理空间上的连续，存储的所有元素都会按序存放在同一块内存区域中。链表是逻辑上的连续，存储的所有元素可能不在同一块内存，元素之间以指针连接。

为啥要说这个呢？因为聚簇索引和非聚簇索引的区别也大致是相同的：

聚簇索引：逻辑上连续且物理空间上的连续。非聚簇索引：逻辑上的连续，物理空间上不连续。

当然，这里的连续和数组不同，因为索引大部分都是使用 B+Tree 结构存储，所以在磁盘中数据是以树结构存放的，所以连续并不是指索引节点，而是指索引数据和表数据，也就是说聚簇索引中，索引数据和表数据在磁盘中的位置是一起的，而非聚簇索引则是分开的，索引节点和表数据之间，用物理地址的方式维护两者的联系。

不过一张表中只能存在一个聚簇索引，一般都会选用主键作为聚簇索引，其他字段上建立的索引都属于非聚簇索引，或者称之为辅助索引、次级索引。但也不要走进一个误区，虽然 MySQL 默认会使用主键上建立的索引作为聚簇索引，但也可以指定其他字段上的索引为聚簇索引，一般聚簇索引要求索引必须是非空唯一索引才行。

其实就算表中没有定义主键， InnoDB 中会选择一个唯一的非空索引作为聚簇索引，但如果非空唯一索引也不存在， InnoDB 隐式定义一个主键来作为聚簇索引。

当然，主键或者说聚簇索引，一般适合采用带有自增性的顺序值。

对于聚簇、非聚簇索引的区别、两者的

本文地址：https://www.cknow.cn/archives/12551

以上内容源自互联网，由百科助手整理汇总，其目的在于收集传播生活技巧，行业技能，本网站不对其真实性、可靠性承担任何法律责任。特此声明！

如发现本站文章存在版权问题，烦请提供版权疑问、侵权链接、联系方式等信息发邮件至candieraddenipc92@gmail.com，我们将及时沟通与处理。

mysql创建索引索引

奥德赛怎么连接蓝牙,奥德赛蓝牙怎么打开

上一篇 2022年11月16日 09:13

拼多多Temu的第一刀，“砍”得SHEIN有多痛？

下一篇 2022年11月16日 09:30

综合

加油站晨会记录怎么写,加油站每天的晨会内容

来源：人民网－人民日报海外版也是在9月，哈萨克斯坦北方草原最美的日子，通常被称为金色草原。那天，正是2019年9月4日，上午，我和刘亮程、徐可应邀参加“亚洲作家论坛”，哈萨克斯坦…

2022年10月25日
综合

武汉东站开通了会有哪些车,武汉东站开通后去哪些地方

12日上午7时26分武汉东站发出首趟列车开往黄冈东站武汉东站继武昌、汉口、武汉火车站之后武汉东站将作为第四个通车的铁路客运站于今日（8月12日）正式开通运营 C562…

2022年10月25日
综合

三位的密码箱怎么开锁,忘记密码怎么打卡

拿出密码箱找一个光线好的地方，从密码转轮的缝隙看去，拨动密码转轮，你会发现有一个缺口(凹进去的)。如图：数字7和4缝隙都是正常的，数字0缝隙那个是缺口（凹进去的）。（找光线好的地…

2023年3月20日
综合

李佳琦罗永浩开干，双11倒计时……

真正的“双11之战”3小时后将正式打响。 2021年的双11“哑火”，但天猫和京东还是共同带来了史无前例9000亿的销售额。今年，抖音、视频号强势入局，罗永浩、俞敏洪头部主播转…

2022年10月24日
综合

“无限续航”能否撑起雅迪的技术梦？

近日，有平台将电动汽车和两轮电动车的数据进行了一次全面对比，今年上半年，5家上市的新造车企均处于亏损状态，而雅迪、爱玛、新日和九号4家公司总盈利加起来则为18.9亿元。不过，也有…

2022年10月28日
综合

烤箱烤羊腿肉的温度和时间,烤箱烤羊腿需要多少时间

用料羊腿迷迭香黑胡椒罗勒碎大蒜粉橄榄油孜然粒蜂蜜盐烤羊腿-烤箱版的做法羊腿洗净，并将表面的肥肉和多余的油脂去除掉。两面分别划几刀，刀缝之间大概是2-3厘米宽…

2022年10月23日
综合

华为实际真正的大股东是谁,华为集团最大10个股东在哪里

近日，华为的“鸿蒙之父”王成录博士被曝离开了华为。作为任正非的得力干将，王成录不仅主导了鸿蒙系统的，还曾领到过EMUI 9.0、EMUI10.0等的重要核心产品的开发和升级。这样的…

2022年11月14日
道路摄像头的分类及功能,道路上各种摄像头作用图解

当我们驾驶车辆行驶在交通路口时，会经常看到各式各样的车辆违章拍摄摄像头。这是因为近年来国家道路上行驶的机动车越来越多，国家的公安交通管理部门为了维护道路交通秩序，减少公路上出现意外…

2023年3月16日 • 综合
综合

AI作画，“饿死”画家？

关于“AI作画”的讨论，已经持续了一段时间，这是一连串事件的连锁作用和肉眼可见的科技突破出现后的结果。 8月，美国游戏设计师Jason Allen用一张AI绘画作品《太空歌剧院》，…

2022年10月24日
知网数据库的发展历程

知网因滥用市场支配地位被罚8670万！消息传来，上至院士博导，下到大一新生，但凡跟“学术”二字打交道的，无不欢欣鼓舞。放眼改革开放以来的学术史，除了1999年知网成立外，恐怕找…

2023年3月21日 • 综合
综合

手机芯片的寒冬：低迷的手机市场，挤牙膏的芯片技术

光线追踪，这个曾经只被端游玩家讨论的词，在今年年底终究是被手游玩家 “够到”了。 11月，联发科和高通相继在手机芯片上实现了“移动光追”，一时间引起了热议。“这可能会给…

2022年12月21日
综合

为什么屏蔽线只允许一端接地,信号屏蔽线为什么单端接地

在测量控制中有供电地系统、模拟信号地系统、数字信号地系统。为了消除各地系统之间的相互干扰，各地系统的地应隔离开。但地与接地是不同的概念，这里的地是指系统的公共参考点。而人们常说的接…

2023年3月11日

索引页是哪一页,索引表是目录吗

相关推荐