基于mysql 默认排序规则的坑

2023年 5月 1日 40.3k 0

mysql默认varchar类型是对大小写不敏感(不区分),如果想要mysql区分大小写需要设置排序规则: utf8_bin将字符串中的每一个字符用二进制数据存储,区分大小写。 utf8_genera_ci不区分大小

mysql默认varchar类型是对大小写不敏感(不区分),如果想要mysql区分大小写需要设置排序规则:

utf8_bin将字符串中的每一个字符用二进制数据存储,区分大小写。

utf8_genera_ci不区分大小写,ci为case insensitive的缩写,即大小写不敏感。

utf8_general_cs区分大小写,cs为case sensitive的缩写,即大小写敏感。

用utf8_genera_ci没有区分大小写,导致这个字段的内容区分大小写时出问题,比如作为区分大小写的code或者验证码时就出问题了。

utf8_general_cs这个选项一般没有,所以只能用utf8_bin区分大小写。

1)设置排序规则是可逆的,如果之前设置的排序规则不符合,更换排序规则后,可能出现乱码,当再次恢复原来的排序规则后,乱码即消失。

2)可以将varchar 类型改为 varbinary

3)如果已经使用了默认的排序规则,即utf8_genera_ci,而又想查询结果大小写区分,可以在查询时进行限定:

select binary column from table;

或者

select column2 from table where binary cloumn;

补充:mysql中的字符集和排序规则

字符集:

字符是各种文字和符号的总称,字符集就是字符的集合。常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。

计算机要识别各种字符集文字,就需要字符编码。所以有些字符集一个字符是2个字节,有些字符集一个字符是3个字节。

排序规则:举例

utf_bin和utf_general_ci这两者到底有什么区别。

ci是case insensitive, 即"大小写不敏感",a 和 A 会在字符判断中会被当做一样的;

bin是二进制, a 和A 会别区别对待.

utf8_general_ci不区分大小写,这个你在注册用户名和邮箱的时候就要使用。

utf8_general_cs区分大小写,如果用户名和邮箱用这个 就会照成不良后果

utf8_bin:字符串每个字符串用二进制数据编译存储。区分大小写,而且可以存二进制的内容

所以排序规则主要说明了是否大小写敏感和存储方式。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持每日运维。如有错误或未考虑完全的地方,望不吝赐教。

相关文章

Oracle如何使用授予和撤销权限的语法和示例
Awesome Project: 探索 MatrixOrigin 云原生分布式数据库
下载丨66页PDF,云和恩墨技术通讯(2024年7月刊)
社区版oceanbase安装
Oracle 导出CSV工具-sqluldr2
ETL数据集成丨快速将MySQL数据迁移至Doris数据库

发布评论