MySQL 学习笔记(二)MVCC 机制

2023年 10月 16日 35.7k 0

之前在讲 MySQL 事务隔离性提到过,对于写操作给读操作的影响这种情形下发生的脏读、不可重复读、虚读问题。是通过MVCC 机制来进行解决的,那么MVCC到底是如何实现的,其内部原理是怎样的呢?我们要抓住三个方面:记录中的4个隐藏字段、undo log 和 read view。

一、MVCC 定义和解决的读问题

1. 事务并发一致性的读问题

脏读(Dirty Read)

脏读也就是当前事务读取到了其他事务还未提交的数据。我们举个例子来看看:

Time session A session B
1 -设置当前会话事务隔离级别为:读未提交 set session transaction isolation level read uncommitted;
2 -设置当前会话事务隔离级别为:读未提交 set session transaction isolation level read uncommitted;
3 start transaction; select * from account;
4 start transaction; select * from account; update account set user_name = '孙七' where id = 6;
5 select * from account; 查询到了session B 中还没有提交的数据

不可重复读(Non-Repeatable Read)

不可重复读是两次读取的结果不相同,和脏读的区别就是不可重复读读到了其他事务提交后的数据。

举个实例来看看:

Time session A session B
1 -设置当前会话事务隔离级别为:读已提交 set session transaction isolation level read committed;
2 -设置当前会话事务隔离级别为:读已提交 set session transaction isolation level read committed;
3 start transaction; select * from account;
4 start transaction; select * from account; update account set user_name='赵赵' where id = 1; -此时已经发生修改 select * from account;
5 select * from account;
6 commit;
7 select * from account;对于未提交的事务,查询不到。相对于前一个隔离级别,杜绝了未提交事务修改对另外会话的影响。一旦另外的会话提交后,在进行查询时,会查出相应的修改。即在一个完整会话中,前后查询不同。

虚读(Phantom)

所谓虚读,也就是根据某些搜索条件先后查询数据库,发现两次查询结果条数不同。和不可重复读的区别就是不可重复读的条数没有变化,虚读条数因为修改操作造成了条数变化。

下面举个实例来说明:

Time session A session B
1 -设置当前会话事务隔离级别为:可重复读 set session transaction isolation level repeatable read; select @@transaction_isolation;
2 -设置当前会话事务隔离级别为:可重复读 set session transaction isolation level repeatable read; select @@transaction_isolation;
3 start transaction; select * from account;
4 start transaction; select * from account; insert into account values(7,'刘八',100); -此时已经发生修改 select * from account;
5 select * from account;
6 commit;
7 select * from account; insert into account values(7,'刘八',100);虽然此时查询全表没有发现新的数据,但是这个时候插入和session B 中相同的插入语句却提示存在一条 key = 7 的语句,说明 session B 的操作确实影响到了 session A 。 这就是虚读

2.MVCC的定义

全称叫 Multi-Version Concurrency Control 的多版本并发控制。也就是指“维持一个数据的多个版本,使得读写操作没有冲突”。

在说明 MVCC 原理前,先了解一下 InnoDB 的当前读和快照读:

当前读

当前读,也就是它读取的是记录的最新版本,而且还要保证其他并发事务不能修改当前记录,实现方式是对读取记录进行加锁。比如下面给出的都是当前读

#共享锁
select lock in share mode;
select for update;
#排他锁
update
insert
delete

快照读

快照读是一种基于多版本并发控制(MVCC)的不加锁读取形式,由于多版本控制,使得快照读读到的可能不是数据的最新版本。比如不加锁的select 操作就是快照读。

二、MVCC 实现原理

1. 记录的三个隐藏字段

对于InnoDB 存储引擎来说,它的每条聚簇索引记录中都包含有以下三个隐藏字段:

  • row_id:隐藏主键。如果该数据表中没有设置主键,就会自动生成一个6字节的row_id
  • roll_pointer:回滚指针。 指向旧版本的 undo 日志
  • trx_id:最近修改记录的事务ID。记录创建这条记录或者最后一次修改该记录的事务ID

如图所示,row_id 表示该记录生成的唯一隐式主键;trx_id 表示当前操作该记录的事务ID;roll ptr 是指向上一版本的 undo 日志的地址。

2. undo 日志

undo log 就是回滚日志,之前在事务的原子性中介绍过,它是保证事务原子性的机制。undo 日志保存的只有 insertdeleteupdate这些修改记录的操作。下面举个例子来帮助理解 undo log 的执行流程:

  • 1.有一个事务编号为1 的事务向数据表中插入一条记录,此时事务的状态是:

    • row_id:隐藏主键为1
    • trx_id:创建该记录的事务ID
    • roll ptr:其上个版本的 undo 日志为空
  • 2.第二个事务编号为2的事务对该记录进行修改,将name 字段的 ethan 改为 bob。此时的操作有:

    • 修改数据时,数据库会对该行加排他锁
    • 把该行数据拷贝一份到 undo log 中
    • 拷贝完成后,再修改该记录name 字段的 ethan 为 bob、修改隐藏字段的事务ID 为2,回滚指针指向拷贝到 undo log 的记录。
    • 事务提交后释放排他锁

  • 3.若第三个事务ID 为 3 对记录的age 字段进行了修改,将 20 修改为 18,则会出现:

    • 事务3修改记录时,数据库对该行加排他锁
    • 数据库将该行数据拷贝到 undo log 中
    • 拷贝完毕后将该记录字段的 age 改成 18。修改隐藏事务ID 为 3,回滚指针指向上个版本的地址
    • 事务提交后释放锁

从第二次我们会发现,undo log 中会出现多个版本的日志。这就是版本链。链首是最新的旧记录,链尾是最早的旧记录。

3. ReadView(读视图)

ReadView 定义

ReadView 是事务进行快照读那一刻,生成的一个数据系统当前的快照,记录并维护当前活跃事务的id,并且这个 ID 值是递增的。ReadView 的作用就是用来做可见性判断,记录当前事务执行快照读时,创建的ReadView 能够看到哪些版本的数据。

那么是ReadView 是怎么判断的呢?

ReadView 版本可见性判断规则

在ReadView 视图中主要有四个重要的属性:

  • trx_list: 一个数值列表,当前系统活跃的读写事务的事务id 列表

  • min_trx_id: trx_list 中最小的事务id,trx_list 中的最小值

  • max_trx_id: 不是trx_list 的最大值,它是指系统应该分配给下一事务的事务id 值

    • 比如现在 trx_list 中有id 为1、2、3、4的事务,那么max_trx_id 的值就是5
  • creator_trx_id:生成该 ReadView 事务的事务ID

在访问某条记录时,只需要按照下面的步骤来判断记录的某个版本是否可见:

  • 1.(trx_id == creator_trx_id)若被访问版本的trx_id值与当前 ReadView 中的 creator_trx_id 相同,也就是说当前事务在访问它自己修改过的记录,该版本可以被当前事务访问。

  • 2.(trx_id < min_trx_id)若被访问版本的trx_id 值小于 ReadView 的 min_trx_id 值,表明生成该版本的事务在当前事务生成ReadView 以前已经提交,该版本可以被当前事务访问。

  • 3.(trx_id >=max_trx_id)若被访问版本的trx_id 值大于或等于 ReadView 中的 max_trx_id ,表明生成该版本的事务在当前事务生成 ReadView 后才开启,该版本可以被当前事务访问。

  • 4.(min_trx_id

相关文章

JavaScript2024新功能:Object.groupBy、正则表达式v标志
PHP trim 函数对多字节字符的使用和限制
新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
为React 19做准备:WordPress 6.6用户指南
如何删除WordPress中的所有评论

发布评论