本文内容都以MySQL 8.0.x + 的Innodb存储引擎来做示例。
在MySQL中一个表的数据在磁盘上是如何存储的?
独立表空间:每一个表都将会以独立的文件方式来进行存储,每一个表都有一个.ibd文件。
其中这个文件包括了单独一个表的数据内容、索引内容以及数据字典。
而表空间内部又是如何构成的?
(如下图)
表空间(tablespace)由多个数据段构成
段:
- 是构成索引、表、回滚段的基本元素。
- 当创建一个索引树时,会同时创建两个段(数据段、索引段),即一个索引产生两个段。
从而还可以得出结论:
一张Innodb引擎的表创建,必定会产生两个段:索引x2
因为Innodb表都是由索引树+叶子节点构成
区:
- 构成段的基本元素,每个区固定大小为1MB
- 一个区由连续的64个页构成
- 一个段中至少有一个区,当创建一个段的时候会自动创建一个区,如果需要存放更多数据则分配新的区。
- 在段中,区的位置由指针建连
页:
- 组成区的最小单元,64个页默认组成一个区
- 逻辑上和物理上每个页都是连续的,页与页通过双向指针相连
- 页的最小单元为16KB
- 页的类型包括:数据页、索引页、undo页、系统页等
行:
- 构成数据页的最小单元,最小为2字节。故可以计算出单页上最多存储16KB/2-200=7992行数据
- 在页中的每行数据都是通过行的单向指针相互连接
- 聚簇索引中:按照PK排序
- 非聚簇索引:通过隐藏列(DB_ROW_ID)排序
细节一波
关于“页”,其实一个数据页上由很多部分构成
- 头指针(连接相邻的页)
- 页指针(当前页的全部数量,当前页中实际有效的数据量)
- 最大值、最小值
- 行数据
- 剩余空间
- 页的数据字典
- 页尾
关于“行”,由两大部分组成
- 记录的额外数据:变长字段的长度列表、NULL值标志位、记录头信息
- 记录的数据内容:三个隐藏列、列1、列2、列3…