1.精通MySQL—基础 MySQL 知识、进阶 MySQL知识

2023年 10月 2日数据运维大白菜程序猿

本文目录如下：

精通MySQL — 基础 MySQL 知识

一、基础理论

SQL语言包括哪几部分？每部分都有哪些操作关键字？
数据库的三大范式是什么？
说说 MySQL 的基础架构？存储引擎有什么作用？
⼀条 SQL 查询语句的执行流程？
什么是视图？为什么要使用视图？

二、数据格式 & 关键字

MySQL中 char 和 varchar 的区别是什么？
MySQL里记录货币用什么字段类型好?
blob 和 text 有什么区别？
MySQL 中 Exists 和 IN 有什么区别？
UNION 与 UNION ALL 的区别？
count(*) 与 count(列名) 的区别？
delete、truncate 和 drop 的区别？

三、事务

数据库事务的特性 (ACID)？
事务有几种隔离级别？
什么是脏读？不可重复读？幻读？

四、存储引擎

存储引擎：MyISAM 和 InnoDB 的区别？
如何选择数据引擎？
InnoDB 和 MyISAM 的索引结构有什么区别？
聚簇索引与非聚簇索引的区别？
谈一谈 MySQL 中的回表？

五、索引

什么是索引？
常用的索引有哪几种类型？
主键索引与唯一索引的区别?
为什么使用索引会加快查询？
索引有什么缺点？
创建索引的原则有哪些？
创建了A, B 组合索引，使用 B 能否索引
索引什么时候会失效?
MySQL 索引用的什么数据结构 (B+树)？
B+树相比于 B树有什么优点？

六、日志

MySQL 中有哪些日志文件？
redo log 的两次提交的过程？
redo log 为什么要分两次提交？

七、锁

表锁和行锁的区别？共享锁和排他锁的区别？
MySQL 的乐观锁和悲观锁了解吗？

七、高可用 & 性能

如何做 MySQL 的性能优化？
数据库读写分离了解吗？
如何进行分库？
如何进行分表？
分库分表会带来什么问题呢？

八、其他

什么是数据库连接池? 为什么需要数据库连接池呢?
如何防止 SQL注入？

精通MySQL — 进阶 MySQL 知识

百万级别以上的数据如何删除？
百万级别以上大表如何添加字段？
100万数据的 A表和10万数据的 B表进行Join操作，哪个表在前？
商品超卖的解决方案？
批量往数据库导入1000万条数据方法？
大数据量的分页优化方案?
MySQL 服务器 CPU 飙升的话，要怎么处理呢？

精通MySQL — 基础 MySQL 知识

一、基础理论

SQL语言包括哪几部分？每部分都有哪些操作关键字？

数据定义(DDL): CREATE、DROP、ALTER等语句

数据操作(DML): INSERT(插入)、UPDATE(修改)、DELETE(删除)语句

数据查询(DQL) : SELECT语句

数据控制(DCL): GRANT、REVOKE、COMMIT、ROLLBACK等语句。

数据库的三大范式是什么？

第一范式：表的每一列都不可分割。

第二范式：要求实体的属性完全依赖于主关键字，即不存在部分依赖。

第三范式：消除非主键之间的传递依赖关系，即不存在传递依赖。

说说 MySQL 的基础架构？存储引擎有什么作用？

MySQL 基础架构 包含三部分：客户端、Server层、存储引擎层。

Server 层：负责连接管理、权限认证等操作；将 API请求转换为存储引擎可以理解的操作。

存储引擎层：位于最底层，存储引擎负责管理数据文件、索引文件、数据读写操作。

⼀条 SQL 查询语句的执行流程？

1.先由 Server 层 检查该语句是否有执行权限，没权限则返回错误信息。

2.有权限则由分析器进行语法分析，判断 sql 语句是否有语法错误。

3.若没有语法错误，则优化查询语句，然后交给 存储引擎层 进行处理，返回执行结果。

什么是视图？为什么要使用视图？

点击查看

视图是一个虚表，只存放定义，而不存放对应的数据。

视图能够简化操作, 可以更清晰的表达查询。

二、数据格式 & 关键字

MySQL中 char 和 varchar 的区别是什么？

char(n) ：固定长度，长度不够的部分用空格补充；适用场景：存储用户ID 等长度固定的字段。

varchar(n) ：可变长度。

总结：从空间上考虑 varcahr 比较合适；从效率上考虑 char 比较合适。

MySQL里记录货币用什么字段类型好?

在 MySQL 中，金额用 DECIMAL 类型。

DECIMAL 类型的值作为字符串存储，⽽不是作为二进制浮点数存储，和 Java 中的 BigDecimal 类似。

blob 和 text 有什么区别？

blob 用于存储 二进制数据 (字节字符串)，主要用于存储图片等非文本数据。

text 用于存储 字符串 (字符字符串)，主要用于存储文章等文本数据。

MySQL 中 Exists 和 IN 有什么区别？

IN 则用于判断一个值是否在指定的值列表中。

Exists 用于判断表中是否存在记录，即使记录为空也可以。Exists 更高效。

注：MySQL 会把 IN 的查询语句改成 Exists 再去执行。

# 下面两句话等价 SELECT * FROM table_name WHERE column_name IN ('value1', 'value2'); SELECT * FROM table_name WHERE EXISTS (SELECT * FROM table_name WHERE column_name = 'value1' OR column_name = 'value2');

UNION 与 UNION ALL 的区别？

UNION：会合并重复的记录行

UNION ALL：不会合并重复的记录行

从效率上说：UNION ALL 要⽐ UNION 快很多，因为不需要合并数据。

count(*) 与 count(列名) 的区别？

点击查看

从执行结果来说：

count(1) 不会过滤空值。

count(列名) 会过滤空值。

从执行效率来说：

如果列为主键，count(列名) 效率优于 count(*)。

如果列不为主键，count(*) 效率优于 count(列名)。

count(1) 和 count(*) 效率相同。

delete、truncate 和 drop 的区别？

delete：根据条件删除行数据

truncate：删除全表数据，保留表结构

drop：删除全表数据，删除表结构

注：执行速度一般来说：drop > truncate > delete

三、事务

数据库事务的特性 (ACID)？

数据库–事务的ACID–介绍/详解

事务 是一个不可分割的操作序列，也是数据库并发控制的基本单位。事务的四大特性：

原子性: 要么全部执行成功，要么全部不执行。

一致性: 事务前后数据的完整性必须保持一致。

隔离性: 事务之间互不干扰。

持久性: 事务一旦提交，它对数据库的改变就应该是永久性的。

注：分布式的 CAP 原则：一致性、可用性、分区容错性。

事务有几种隔离级别？

级别	名字	含义	脏读	不可重复读	幻读	数据库默认隔离级别
1	`读取未提交`	可读取其它事务未提交的结果	√	√	√
2	`读取已提交`	只能读到其他事务已经提交的修改	×	√	√	Oracle
3	`可重复读`	同一条件的查询返回的结果是一样的	×	×	√	`MySQL`
4	`可串行化`	/	×	×	×

什么是脏读？不可重复读？幻读？

脏读：事务A 读取了事务B 更新的数据，然后事务B 回滚操作，那么事务A 读取到的数据是脏数据。

不可重复读：事务A 多次读取同一数据，事务B 在事务A 读取过程中，更新了数据，导致事务A 多次读取同一数据结果不一致。

幻读：当事务A 读取某个范围内的记录时，事务B 又在该范围内插入了新的记录，当事务A 再次读取该范围的记录时，会产生幻行。

总结:

脏读是因为 事务回滚。

不可重复读是因为 修改数据。

幻读是因为 新增或删除数据。

四、存储引擎

存储引擎：MyISAM 和 InnoDB 的区别？

MySQL–存储引擎–MyISAM和InnoDB的区别

InnoDB：支持事务，支持 行级锁。支持 崩溃恢复。

MyISAM：不支持事务，支持 表级锁。不支持 崩溃恢复。

如何选择数据引擎？

默认使用 InnoDB 即可。

InnoDB：适合 并发读写 或 增删改频繁 的场景，因为 InnoDB 支持事务和行锁。

MyISAM：适合 查询频繁 的场景。

InnoDB 和 MyISAM 的索引结构有什么区别？

InnoDB 中的 主键索引 的叶子节点存储的是 实际数据，也就是 聚簇索引。

MyISAM 中的 主键索引 的叶子节点存储的是 数据地址。就是普通的主键索引。

总结：InnoDB 和 MyISAM 的索引结构主要区别在于 主键索引，除了主键索引之外都是 非聚簇索引。

聚簇索引与非聚簇索引的区别？

聚簇索引和非聚簇索引有什么区别？

聚簇索引：叶子节点就是 实际数据。

非聚簇索引: 叶子节点存储的是主键键值，一次查询后需要根据主键键值在主键索引上进行 回表 查询

⼀个表中只能有⼀个 聚簇索引，但是可以有多个 非聚簇索引。

注：聚簇索引 决定了数据的物理存储顺序，因此在查询中可以直接提供实际数据。

谈一谈 MySQL 中的回表？

MySQL 中的回表

在 MyISAM 存储引擎里，先通过非聚簇索引找到主键索引的键值，再通过主键索引查询数据，它比基于主键索引的查询多扫描了⼀棵索引树，这个过程就叫 回表。

例如：select * from user where name = '张三';

五、索引

什么是索引？

索引 是数据表中的一列或多列数据。可以用来加快查询速度。

创建索引会生成相应的索引文件，查询时则不需要遍历整张表。

常用的索引有哪几种类型？

主键索引：用于确定每一条记录的唯一标识符。

唯一索引：确保表中的某个列的值是唯一的。

普通索引：根据单个列的值来查询数据。

组合索引：根据多个列的值来查询数据。

主键索引与唯一索引的区别?

MySql主键和唯一索引的区别

一个表只能有一个 主键索引，一个表能创建多个 唯一索引。

主键索引不能为 null，唯一索引可以为 null。

为什么使用索引会加快查询？

数据库在执行一条 SQL语句的时候，默认是根据搜索条件进行全表扫描。

添加索引之后，MySQL 会生成⼀个 索引文件，查询数据时通过索引文件查找，大幅减少扫描行数，从而提高了查询效率。

索引有什么缺点？

降低了数据写入的效率：增删改操作要更新对应的索引文件。

索引占物理空间

创建索引的原则有哪些？

数据库中哪些情况需要创建索引，哪些情况不需要创建索引

创建索引 的情况：

查询 频率高的字段创建索引

经常 排序 (order by) 的字段创建索引

经常 分组 (group by) 的字段创建索引

一般情况尽量创建 唯一索引
-高并发情况尽量创建 组合索引 【参考最左匹配原则】

不创建索引 的情况：

频繁 更新 的字段不适合创建索引

频繁 增删改 的表不适合创建索引

创建了A, B 组合索引，使用 B 能否索引

MySQL联合索引–使用/原理/优化

在当 A 的值确定的情况下，B 的值也是有序的。即在 A 确定时能使用 B 索引。

注：组合索引 遵循 最左匹配原则。

索引什么时候会失效?

like 以 % 或者 _ 开头的时候

对索引列进行 计算 或使用 函数 的时候

MySQL 索引用的什么数据结构 (B+树)？

MySQL 的默认存储引擎是 InnoDB，它采用的是 B+树 结构的索引 (聚簇索引)。

B+树 中非叶子节点存储多个索引和多个分支，一般情况下 3次比较就能查询到数据。

B+树 中只有叶子节点才会存储数据，非叶子节点只存储键值。

叶子节点之间使用双向指针连接，形成了⼀个 双向有序链表。

B+树相比于 B树有什么优点？

B+树的特点和优势

B+树 中只有叶子节点才会存储数据，非叶子节点只存储键值。叶子节点之间使用 双向指针 连接，形成了⼀个 双向有序链表。因此有如下优点：

范围查询 和 排序能力 更强：叶子节点之间使用双向指针连接。

扫表能力更强：进行全表扫描只需要遍历叶子节点就可以了。

六、日志

MySQL 中有哪些日志文件？

bin log 日志：记录了所有数据变更操作，包括 INSERT、UPDATE、DELETE 等操作。

redo log 日志：用于事物重做操作。事务执行前将 事务操作 记录到 undo Log 中。

undo log 日志：用于事务回滚操作。事务执行前将 原始数据 记录到 undo Log 中。

注：事务中断进行恢复时，是要结合 redo log 和 bin log 进行数据恢复的。

redo log 的两次提交的过程？

redo log 为什么要分两次提交？

首先，redo log 写入代表事务已提交，bin log 写入代表数据已写入。

prepare 阶段：将更新提交到 redo log，然后 redo log 标记状态为 prepare。

commit 阶段：将更新写入磁盘，即写入 bin log，然后 redo log 标记状态为 commit。

redo log 为什么要分两次提交？

【MySQL】一文彻底搞懂 Redo-log 为什么要两阶段提交？

提高数据库的性能：将数据首先写入内存比直接写入磁盘要快得多。

确保数据的持久性：因为数据最终会被同步写入磁盘，两次提交的过程也叫做预写日志(WAL)，可以保证数据一致性和可恢复性。

七、锁

表锁和行锁的区别？共享锁和排他锁的区别？

MySQL–行级锁与表级锁

行锁：会死锁。发生锁冲突的概率小，并发度高。

表锁：不会死锁。发生锁冲突的概率高，并发量低。

注：FOR UPDATE 和 FOR SHARE 都是 行锁。

如果按照兼容性，可分为两种：

共享锁：也叫读锁，读锁之间相互不排斥。

排它锁：也叫写锁，写锁排斥其他写锁和读锁。

注：FOR UPDATE 是 排他锁；FOR SHARE 都是 共享锁。

MySQL 的乐观锁和悲观锁了解吗？

悲观锁：认为并发访问时一定会发生冲突，因此访问数据前都会上锁。

行锁、表锁、共享锁、排它锁 都是 悲观锁。

乐观锁: 认为并发访问时不会发生冲突，只是在修改数据时检测数据是否被修改 (CAS 算法)。

乐观锁只能由开发人员在程序中实现。

七、高可用 & 性能

如何做 MySQL 的性能优化？

避免不必要的列：避免使用 select *。

索引优化：根据索引创建原则合理地添加索引。

合适的存储引擎：选择正确的存储引擎。(判断业务查询操作多还是更新操作多来选择存储引擎)

分页优化：在数据量比较大，需要考虑分页。

读写分离

分库分表

数据库读写分离了解吗？

读写分离 的基本实现是:

1.数据库服务器搭建 主从集群。(⼀主⼀从、⼀主多从都可以)

2.主节点 (master) 处理写操作，从节点 (slave) 处理读操作。

3.主节点通过 主从复制 将业务数据同步到从节点。

如何进行分库？

垂直分库：以表为依据，按照业务归属不同，将不同的表拆分到不同的库中。

⽔平分库：以字段为依据，按照⼀定策略，将⼀个表中的数据拆分到多个库中。

如何进行分表？

水平分表：以字段为依据，按照⼀定策略，将⼀个表中的数据拆分到多个表中。

垂直分表：以字段为依据，按照字段的活跃性，将表中字段拆到不同的表（主表和扩展表）中。

分库分表会带来什么问题呢？

事务的问题：分库之后无法使用单机事务，必须使⽤分布式事务来解决。

跨库 JOIN 问题：跨库了之后就无法 JOIN，只能在业务代码中进行关联。

跨节点的 count, group by 以及聚合函数问题：只能在业务代码中实现。

八、其他

什么是数据库连接池? 为什么需要数据库连接池呢?

数据库连接池原理：在内部对象池中，维护一定数量的数据库连接，并对外暴露数据库连接的获取和返回方法。

提高响应速度：高并发场景下大量创建连接程很费时, 使用连接池可以提高响应速度。

统一的连接管理，避免数据库连接泄漏

如何防止 SQL注入？

数据库–防止SQL注入的方案

权限区分：普通用户与系统管理员用户的权限要有严格的区分。

使用合适的ORM框架：好的 ORM框架可以很大程度防止SQL注入。推荐使用：MyBatis-Plus。

对用户的输入进行验证

精通MySQL — 进阶 MySQL 知识

百万级别以上的数据如何删除？

当我们对数据进行 增加、修改、删除 操作时, 会产生额外的对 索引文件 的操作, 这些操作会降低执行效率。所以删除数据的速度和索引数量是成正比的。

因此删除百万级别数据的步骤如下：

先删除索引。

然后删除⽆⽤数据。

删除完成后重新创建索引 (速度很快)。

百万级别以上大表如何添加字段？

当表中数据量到达百万级别以上时，加一个字段就没那么简单，因为可能会长时间锁表。

大表添加字段，通常有这些做法：

通过中间表转换：创建⼀个临时的新表，把旧表的结构完全复制过去，添加字段，再把旧表数据复制过去，删除旧表，新表命名为旧表的名称，这种方式可能会丢失数据。

先在从库添加字段，然后进行主从切换。

100万数据的 A表和10万数据的 B表进行Join操作，哪个表在前？

在进行 表连接 (Join) 操作时，通常将 较小的表放在前面效率更高。

数据库进行表连接时，会从左表中选择一行记录，然后在右表中查找匹配的记录。

原理：减少外层循环次数。

商品超卖的解决方案？

避免商品超卖的4种方案

最优的解决方案：

使用 Redis队列来实现。将要促销的商品数量以队列的方式存入 Redis，每当用户抢到一件促销商品则从队列中删除一个数据，确保商品不会超卖。这个方法效率极高。

// 使用 Redis队列实现，用户过来直接入队列，然后再将操作更新到数据库 // 最佳体验（redis pconnect 9.481s, 无丢失，无框架） public void push() { // 入队列 jedis.lpush(QUEUE, "1"); }

// 脚本调用pop方法 public void pop() { String key; while ((key = jedis.rpop(QUEUE)) != null) { Shop shop = getShopById(1); // Assuming shop with ID 1 if (shop.getNumber() > 0) { DB.updateShopNumber(shop.getId(), shop.getNumber() - 1); } } }

批量往数据库导入1000万条数据方法？

点击查看

使用 批处理，减少数据库连接次数，同时将单条插入语句改为一次插入多条数据以提高效率。

总结：批处理:一次发送多条SQL语句 + 一条 SQL语句插入多条数据

大数据量的分页优化方案?

MySQL 服务器 CPU 飙升的话，要怎么处理呢？

排查过程：

使⽤ top 命令观察，确定是否是 MySQL 导致的。

如果是 MySQL 导致的，使用 show processlist 查看 session 情况，确定是不是有消耗资源的 sql 在运⾏。

找出消耗高的 SQL语句，分析原因。

作者：大白菜程序猿

链接：https://www.mryunwei.com/417898.html

文章版权归作者所有，未经允许请勿转载。

1.精通MySQL—基础 MySQL 知识、进阶 MySQL知识

本文目录如下：

精通MySQL — 基础 MySQL 知识

一、基础理论

SQL语言包括哪几部分？每部分都有哪些操作关键字？

数据库的三大范式是什么？

说说 MySQL 的基础架构？存储引擎有什么作用？

⼀条 SQL 查询语句 的 执行流程？

什么是视图？为什么要使用视图？

二、数据格式 & 关键字

MySQL中 char 和 varchar 的区别是什么？

MySQL里记录 货币 用什么字段类型好?

blob 和 text 有什么区别？

MySQL 中 Exists 和 IN 有什么区别？

UNION 与 UNION ALL 的区别？

count(*) 与 count(列名) 的区别？

delete、truncate 和 drop 的区别？

三、事务

数据库 事务 的特性 (ACID)？

事务有几种 隔离级别？

什么是脏读？不可重复读？幻读？

四、存储引擎

存储引擎：MyISAM 和 InnoDB 的区别？

如何选择 数据引擎？

InnoDB 和 MyISAM 的索引结构有什么区别？

聚簇索引 与 非聚簇索引的区别？

谈一谈 MySQL 中的回表？

五、索引

什么是索引？

常用的 索引 有哪几种类型？

主键索引 与 唯一索引的区别?

为什么使用 索引 会加快查询？

索引 有什么缺点？

创建索引的 原则 有哪些？

创建了A, B 组合索引，使用 B 能否索引

索引什么时候会失效?

MySQL 索引用的什么数据结构 (B+树)？

B+树 相比于 B树 有什么优点？

六、日志

MySQL 中有哪些日志文件？

redo log 的 两次提交 的过程？

redo log 为什么要分两次提交？

七、锁

表锁 和 行锁 的区别？共享锁 和 排他锁 的区别？

MySQL 的 乐观锁 和 悲观锁 了解吗？

七、高可用 & 性能

如何做 MySQL 的性能优化？

数据库 读写分离 了解吗？

如何进行 分库？

如何进行 分表？

分库分表会带来什么问题呢？

八、其他

什么是数据库连接池? 为什么需要数据库连接池呢?

如何防止 SQL注入？

精通MySQL — 进阶 MySQL 知识

百万级别以上 的数据如何删除？

百万级别以上 大表如何添加字段？

100万数据的 A表 和10万数据的 B表进行Join操作，哪个表在前？

商品超卖 的 解决方案？

批量往数据库导入1000万条数据方法？

大数据量的分页优化方案?

MySQL 服务器 CPU 飙升的话，要怎么处理呢？

大白菜程序猿

本月创作热力图

⼀条 SQL 查询语句的执行流程？

MySQL里记录货币用什么字段类型好?

数据库事务的特性 (ACID)？

事务有几种隔离级别？

如何选择数据引擎？

聚簇索引与非聚簇索引的区别？

常用的索引有哪几种类型？

主键索引与唯一索引的区别?

为什么使用索引会加快查询？

索引有什么缺点？

创建索引的原则有哪些？

B+树相比于 B树有什么优点？

redo log 的两次提交的过程？

表锁和行锁的区别？共享锁和排他锁的区别？

MySQL 的乐观锁和悲观锁了解吗？

数据库读写分离了解吗？

如何进行分库？

如何进行分表？

百万级别以上的数据如何删除？

百万级别以上大表如何添加字段？

100万数据的 A表和10万数据的 B表进行Join操作，哪个表在前？

商品超卖的解决方案？