MySQL5.x优化专题(侧重开发)

数据运维 2024-04-19 泡泡手机阅读

P2 MySQL简介
完整的MySQL优化需要专门的DBA，开发只需要负责写出高效的SQL即可，但仍需要很深的功底，因为SQL易学难精；

高级内容：
MySQL内核（内核优化改写）
SQL优化攻城狮
MySQL服务器优化
各种参数常量设定
查询语句优化
主从复制
软硬件升级
容灾备份
SQL编程

P3 RPM安装
主流都是二进制安装
此处介绍RPM安装，下载GA版本(稳定发布版)
选择Linux-Generic分类
我们下载一个server端一个client端
MySQL5.x优化专题(侧重开发)-每日运维
检查是否安装过MySQL（或MariaDB）

rpm -qa |grep -i mysql

然后rpm -ivh 命令安装服务端
查看安装后的提示：
MySQL5.x优化专题(侧重开发)-每日运维
然后我们根据提示去给root设置密码
然后rpm -ivh 命令安装客户端
然后我们查看用户和用户组，以及查看版本，来检查是否安装成功

cat /etc/passwd |grep mysql cat /etc/group |grep mysql mysqladmin --version

CentOS6启动mysql，以及查看进程

service mysql start ps -ef |grep mysql

P4 设置ROOT密码和开机自启
首次连接只需输入mysql然后回车就可以进入mysql命令行
按照之前提示需要用mysqladmin改root密码：

/usr/bin/mysqladmin -u root password 123456

然后再进入mysql就需要输入密码了
然后u我们设置开机自启

chkconfig mysql on chkconfig --list |grep mysql

此处的1、2、3、4、5、6指的是运行级别
通过cat /etc/inittab查看
然后netsysv检查，开机自启的服务中括号里都有一个星号

P5 安装位置(RPM)
①/var/lib/mysql/
是mysql数据库文件存放路径
pid等文件也存在此目录中
②usr/share/mysql/
配置文件目录
mysql.server命令及配置文件存放于此
③/usr/bin
相关命令目录
如mysqladmin mysqldump
④/etc/init.d/mysql
启停相关脚本

P6 修改字符集
cp my-huge.cng /etc/my.cnf
然后重启mysql
进入mysql
show variables like ‘%char%’;
修改配置文件：
MySQL5.x优化专题(侧重开发)-每日运维
再重启
之后新库就可以支持utf-8了

P7 MySQL配置文件
定义一些日志的开启、路径
数据文件路径
一些优化参数
数据文件：
MySQL5.x优化专题(侧重开发)-每日运维
换InnoDB引擎的话就是.frm和.ibd文件(8.0开始只有.ibd文件)

P8 MySQL逻辑架构介绍
MySQL5.x优化专题(侧重开发)-每日运维
连接层
服务层
引擎层
存储层

P9 存储引擎简介
查看支持的存储引擎、查看默认及当前存储引擎：

show engines; show variables like '%storage_engine%';

MySQL5.x优化专题(侧重开发)-每日运维

P10 SQL性能下降原因
MySQL5.x优化专题(侧重开发)-每日运维

P11 SQL执行加载顺序
MySQL5.x优化专题(侧重开发)-每日运维

P12 七种JOIN理论
MySQL5.x优化专题(侧重开发)-每日运维

这两种有待实验考证

P13 七种JOIN的SQL编写
MySQL5.x优化专题(侧重开发)-每日运维

MySQL语法不支持full outer join，本身使用的场景也很少，实现full outer join使用如下语句

P14 索引
是帮助MySQL高效获取数据的数据结构。
简单理解为排好序的快速查找数据结构，以索引文件的形式存储在磁盘上。
如果没有特别说明，都是指B树，MySQL中B+树，当然还有哈希索引。

P15 索引的优势劣势
优势：
提高检索效率，降低IO成本；
降低排序成本，降低CPU消耗；
劣势：
索引占磁盘空间；
会降低表写操作(插入/更新/删除)的速度；

P16 建索引命令
建议一张表索引不超过5个
MySQL5.x优化专题(侧重开发)-每日运维

P17 索引结构和检索原理
MySQL5.x优化专题(侧重开发)-每日运维
我们主要研究B树索引

P18 哪些情况适合建索引
1.主键自动建索引；
2.频繁查找的字段
3.查询中与其他表关联的字段，外键关系建立索引
4.频繁更新的、where用不到的字段不创建
5.排序字段
6.根据需要创建组合索引
7.查询中分组或统计的字段

P19 哪些情况不适合建索引
1.表记录太少
2.经常增删改的表
3.选择性过低的字段

P20 性能分析前提知识
MySQL5.x优化专题(侧重开发)-每日运维

P21 Explain简介
MySQL5.x优化专题(侧重开发)-每日运维

P22 explain之id
对应“表的读取顺序”
id相同的情况，执行顺序由上至下；
如果是子查询，id的序号会递增，id值越大的优先级越高，越先被执行；
如果是混合的，id值大的先执行，id平级的由上至下
MySQL5.x优化专题(侧重开发)-每日运维
derived是衍生的意思，就是延申出来的虚表，如下图所指的S1

P23 explain之select type和table
MySQL5.x优化专题(侧重开发)-每日运维
1.simple，简单的select，查询中不包括子查询或者union
2.primary，一段查询如果包含任何复杂的子部分，则最外层查询被标记为primary
3.subquery，在select或where列表中包含了子查询
4.derived，在from列表中包含的子查询被标记为衍生表，derived后面的标记数字，对应的是id，如derived2即id为2的子查询衍生出来的表，mysql会递归执行这些子查询，把结果放在临时表中，所以衍生表会使用临时表
5.union，若第二个select出现在union之后，则被标记为union；若union包含在from子句的子查询中，外层select将标记为derived，因为也属于union衍生出来的表
6.union result，从union表获取结果的select（区别于刚才的union在from子句中，这个不用临时表，直接输出结果）
table显示这一行是关于哪张表的，不用多说

P24 explain之type
type指的是访问类型
MySQL5.x优化专题(侧重开发)-每日运维
常见的值有如下几种：

从最好到最差依次如下：
system > const > eq_ref > ref > range > index > all
一般来说，得保证查询至少达到range级别，最好能达到ref
1.system，表里只有一行记录（等于系统表，mysql库带的表），是const类型特例，平时不会出现
2.const，意思是常量，表示通过索引一次就找到了。常见于primary key或unique索引只匹配一行数据的情况；
3.eq_ref，唯一性查找，对于每个索引键，表中只有一条记录与之匹配，常见于主键或唯一索引
4.ref，非唯一性查找，返回匹配某个值的所有行，查找和扫描的混合体
5.range，检索给定范围的行，一般是where语句中出现了between，，in等
6.index，全索引扫描，通常比ALL快
7.all，全表扫描

P25 explain之possible_key和key
possible_keys：显示可能使用的索引，一个或多个，查询涉及到的字段上若存在索引，则该索引将被列出，但不一定被查询实际使用
key：实际使用的索引，如果显示为NULL，则是没建索引或索引失效
查询中若使用了覆盖索引，则该索引仅出现在key列表中

P26 explain之key_len
表示索引中使用的字节数，可通过该列计算查询中使用的索引的长度
在不损失精确性的情况下，长度越短越好。
key_len显示的值为索引字段的最大可能长度，并非实际使用长度，
即key_len是根据表定义计算而得，不是通过表内检索出

P27 explain之ref
显示索引的哪一列被使用了，
如果可能的话，是一个常数。
哪些列或者常量被用于查找索引列上的值
如：
MySQL5.x优化专题(侧重开发)-每日运维
可以是库.表.字段，或常量

P28 explain之rows
根据表统计信息及索引选用情况，大致估算出找到所需记录需要读取的行数，当然是越少越好

P29 exolain之extra
十分重要的额外信息
1.using filesort，使用了文件排序，说明mysql会对数据使用一个外部的索引排序，而不是按照我们表的索引顺序进行读取。mysql中无法利用索引完成的排序称为文件排序；需要我们尽量避免
2.using temporary，使用了临时表保存中间结果，常见于order by排序、分组查询group by
MySQL5.x优化专题(侧重开发)-每日运维
3.using index，表示相应select操作使用了覆盖索引，从索引中就能取得数据，而避免访问了表的数据行；
如果同时出现了using where，表明索引被用来执行索引键值的查找；
如果没有同时出现using where，表明索引用来索引全扫描，而非查找动作
4.using where，表示使用了where过滤
5.using join buffer，表示使用了连接缓存，即配置文件的join_buffer_size
6.impossible where，表示where子句的值总是false，不能用来获取任何元组
7.select tables optimized away，对MyISAM引擎优化COUNT(*)的操作
8.distinct，表示优化distinct，在找到第一匹配的元组后即停止查找相同值的操作

P30 case
MySQL5.x优化专题(侧重开发)-每日运维
答案：
1.id4的步骤，即union后面select name, id from t2
2.id3的步骤，即select id ,name from t1 where …
3.id2的步骤，即子查询select id from t3
4.id1的步骤select d1.name from d1（id3步骤的衍生表）
5.null的步骤，即id1和id4的union结果

P31 索引单表优化案例

MySQL5.x优化专题(侧重开发)-每日运维
where语句中第二个条件是大于，范围查询之后的就无法再走索引了，所以还是有filesort

P32 索引两表优化案例

左外联的话，索引建在关联条件的右表上；
右外联同理，也是“相反加”

P33 索引三表优化案例
MySQL5.x优化专题(侧重开发)-每日运维
结论：
尽可能减少join语句中nestedloop的次数，永远用小表驱动大表
优先优化nestedloop的内层循环
保证join语句中被驱动表上join条件字段已经有索引
若无法保证被驱动表join条件字段有索引，且内存资源充足时，可加大join_buffer_size

P34 索引优化1
MySQL5.x优化专题(侧重开发)-每日运维
如果是组合索引，要遵循最左前缀法则
带头大哥不能死，中间兄弟不能断
（oracle中还要避免跳扫）

P35 索引优化2
不要在索引列上进行任何计算、函数、（显示或隐式）类型转换

P36 索引优化3
范围之后全失效（无法使用组合索引范围条件字段右边的列，如，between，like）

P37 索引优化4
尽量使用覆盖索引，（查询列包含在索引列中），避免使用select *

P38 索引优化5
使用!=或会导致不走索引

P39 索引优化6
is null，is not null也不走索引

P40 索引优化7
like以通配符开头不走索引

P41 索引优化8
字符串类型不加单引号会导致索引失效，因为引发隐式转换
少用or，用它来连接有时也会导致索引失效

P46 小表驱动大表
MySQL5.x优化专题(侧重开发)-每日运维

永远小表驱动大表(连接成本高)

注：两表ID字段应建立索引

P47 in和exists
MySQL5.x优化专题(侧重开发)-每日运维

P48 为排序使用索引order by优化
order by子句，尽量使用using index方式排序，避免使用using filesort方式排序
重点：避免filesort！
MySQL5.x优化专题(侧重开发)-每日运维
如果order by 的字段一个是正序一个是倒序的话，就还是使用filesort，因为默认索引建的都是正序，即字段顺序相同，必须“同升同降”；
4.1版本之前是双路排序，要读两次磁盘，4.1之后改进成为单路排序：
从磁盘中读取查询所需要的所有列，在buffer中按照order by列进行排序，然后扫描排序后的列表进行输出，把随机IO变成顺序IO，但是也占用更多内存；
总体而言单路要优于双路，但是如果取的数据要高于sort_buffer_size的话，就要取好几次直至取完，这样就会产生多次IO，效果会更差；
因此需要增大sort_buffer_size和max_length_for_sort_data这两个参数的设置
MySQL5.x优化专题(侧重开发)-每日运维

P49 慢查询日志
MySQL5.x优化专题(侧重开发)-每日运维

set global slow_query_log=1是临时开启，永久开启需要改配置文件

set global long_query_time=2;
需要重新连接或者新开一个会话才能看到新设置的值；
分析工具mysqldumpslow

当然作为DBA一般我们都用pt工具