MySQL字符集与排序规则
字符集
字符集是一组符号和编码, 排序规则是用于比较字符集中字符的一组规则。
可使用information_schema character_sets
表或show character_set
语句查看可用的字符集。
Unicode、ACCII和UTF-8的区别
Unicode 是一种字符集,它为世界上所有文字的每个字符分配了一个唯一的数字编码。
ASCII(American Standard Code for Information Interchange)是最早的字符编码标准,只能表示英文字符和一些特殊符号,使用7位二进制数表示一个字符。
UTF-8(Unicode Transformation Format-8)则是一种针对 Unicode 的可变长度编码,可以用1至4个字节来表示一个字符,支持包括拉丁文、中文、日文等在内的世界各国语言。
Unicode 是字符集,ASCII 是其中的一种编码方式,而 UTF-8 是另一种更灵活、更通用的编码方式。
排序规则
给定的字符集始终至少具有一种排序规则,并且大多数字符集都具有多种排序规则。
可使用information_schema collations
表或show collation
语句查看字符集的排序规则。
排序规则后缀含义
后缀 | 意义 |
---|---|
_ai | 不区分重音 |
_as | 区分重音 |
_ci | 不区分大小写 |
_cs | 区分大小写 |
_ks | 假名敏感 |
_bin | 二进制 |