【MySQL】02. 索引机制(四):索引设计原则

in #study15 days ago

1 索引设计原则

1.1 代码先行,索引后上

等到主体业务功能开发完毕,把涉及到该表相关sql都要拿出来分析之后再建立索引。

1.2 联合索引尽量覆盖条件

比如可以设计一个或者两三个联合索引(尽量少建单值索引),让每一个联合索引都尽量去包含sql语句里的where、order by、group by的字段,还要确保这些联合索引的字段顺序尽量满足sql查询的最左前缀原则。

1.3 不在小基数字段上建立索引

索引基数是指这个字段在表里总共有多少个不同的值,比如一张100万行记录的表,其中有个性别字段,其值不是男就是女,那么该字段基数就是2。

对这种小基数字段建立索引,索引树里就包含男和女两种值,根本没法进行快速的二分查找,那用索引就没有太大的意义了。所以,一般建立索引要尽量使用那些基数比较大的字段,这样才能发挥出B+树快速二分查找的优势来。

1.4 对小字段建立索引

尽量对字段类型较小的列设计索引,比如说什么tinyint之类的,因为字段类型较小的话,占用磁盘空间也会比较小,在搜索的时候性能也会比较好一点。

1.5 长字符串采用前缀索引

很多时候我们不得不针对varchar(255)这种字段建立索引,那么对于这种varchar(255)的大字段可能会比较占用磁盘空间,可以稍微优化下。

比如针对这个字段的前20个字符建立索引,类似于 KEY index(name(20),age,position)。此时在where条件里搜索的时候,如果是根据name字段来搜索,那么此时就会先到索引树里根据name字段的前20个字符去搜索,定位到之后前20个字符的前缀匹配的部分数据之后,再回到聚簇索引提取出来完整的name字段值进行比对。

但是假如要是order by name,那么此时name因为在索引树里仅仅包含了前20个字符,所以这个排序是没法用上索引的, group by也是同理。

1.6 where与order by冲突时优先where

在where和order by出现索引设计冲突时,一般往往都是让where条件去使用索引来快速筛选出来一部分指定的数据,接着再进行排序。因为大多数情况基于索引进行where筛选往往可以最快速度筛选出你要的少部分数据,然后做排序的成本可能会小很多。

1.7 基于慢sql查询做优化

可以根据监控后台的一些慢sql,针对这些慢sql查询做特定的索引优化。

Coin Marketplace

STEEM 0.18
TRX 0.13
JST 0.030
BTC 58269.26
ETH 3067.65
USDT 1.00
SBD 2.25