首页 > 代码库 > mysql优化实战(explain && 索引)

mysql优化实战(explain && 索引)

实验环境:
1、sql工具:Navicat
2、sql数据库,使用openstack数据库作为示例

一、mysql索引查询
show index from instances
技术分享
结果字段解释:
Table:数据库表名
Non_unique:索引不能包括重复词,则为0。可以,则为1。
Key_name:索引的名称。
索引中的列序列号,从1开始。
列名称
列以什么方式存储在索引中。在MySQL中,有值‘A’(升序)或NULL(无分类)。
索引中唯一值的数目的估计值。通过运行ANALYZE TABLE或myisamchk -a可以更新。基数根据被存储为整数的统计数据来计数,所以即使对于小型表,该值也没有必要是精确的。基数越大,当进行联合时,MySQL使用该索引的机 会就越大。
如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为NULL。
指示关键字如何被压缩。如果没有被压缩,则为NULL。
如果列含有NULL,则为YES。如果没有,则该列为NO。
用过的索引方法(BTREE, FULLTEXT, HASH, RTREE)。
Comment:注释。


二、验证Mysql的主键会自动创建索引?
创建一个没有主键的ttx_index数据库表:
技术分享
查询索引:
技术分享
结果显示没有索引。

改变ttx_index数据库表字段id,将之设为主键,再次查询索引:
技术分享
技术分享

得出结论,在Mysql中,数据库主键会自动建立索引。


三、Mysql性能优化利器:explain
1、首先查看instances数据库表的索引:
技术分享

2、EXPLAIN 用法详解:
EXPLAIN SELECT * FROM instances
技术分享
技术分享
根据上述结果,可以此查询花了0.027ms,没有可用的索引。


explain字段详解:

table:显示这一行的数据是关于哪张表的

type:这是重要的列,显示连接使用了何种类型。从最好到最差的连接类型为const、eq_reg、ref、range、indexhe和ALL

possible_keys:显示可能应用在这张表中的索引。如果为空,没有可能的索引。可以为相关的域从WHERE语句中选择一个合适的语句

key: 实际使用的索引。如果为NULL,则没有使用索引。很少的情况下,MYSQL会选择优化不足的索引。这种情况下,可以在SELECT语句中使用USE INDEX(indexname)来强制使用一个索引或者用IGNORE INDEX(indexname)来强制MYSQL忽略索引

key_len:使用的索引的长度。在不损失精确性的情况下,长度越短越好

ref:显示索引的哪一列被使用了,如果可能的话,是一个常数

rows:MYSQL认为必须检查的用来返回请求数据的行数

Extra:关于MYSQL如何解析查询的额外信息。将在下表中讨论,但这里可以看到的坏的例子是Using temporary和Using filesort,意思MYSQL根本不能使用索引,结果是检索会很慢


extra列返回的描述的意义:

Distinct:一旦MYSQL找到了与行相联合匹配的行,就不再搜索了

Not exists: MYSQL优化了LEFT JOIN,一旦它找到了匹配LEFT JOIN标准的行,就不再搜索了

Range checked for each Record(index map:#):没有找到理想的索引,因此对于从前面表中来的每一个行组合,MYSQL检查使用哪个索引,并用它来从表中返回行。这是使用索引的最慢的连接之一

Using filesort: 看到这个的时候,查询就需要优化了。MYSQL需要进行额外的步骤来发现如何对返回的行排序。它根据连接类型以及存储排序键值和匹配条件的全部行的行指针来排序全部行

Using index: 列数据是从仅仅使用了索引中的信息而没有读取实际的行动的表返回的,这发生在对表的全部的请求列都是同一个索引的部分的时候

Using temporary 看到这个的时候,查询需要优化了。这里,MYSQL需要创建一个临时表来存储结果,这通常发生在对不同的列集进行ORDER BY上,而不是GROUP BY上

Where used 使用了WHERE从句来限制哪些行将与下一张表匹配或者是返回给用户。如果不想返回表中的全部行,并且连接类型ALL或index,这就会发生,或者是查询有问题不同连接类型的解释(按照效率高低的顺序排序)

system 表只有一行:system表。这是const连接类型的特殊情况

const:表中的一个记录的最大值能够匹配这个查询(索引可以是主键或惟一索引)。因为只有一行,这个值实际就是常数,因为MYSQL先读这个值然后把它当做常数来对待

eq_ref:在连接中,MYSQL在查询时,从前面的表中,对每一个记录的联合都从表中读取一个记录,它在查询使用了索引为主键或惟一键的全部时使用

ref:这个连接类型只有在查询使用了不是惟一或主键的键或者是这些类型的部分(比如,利用最左边前缀)时发生。对于之前的表的每一个行联合,全部记录都将从表中读出。这个类型严重依赖于根据索引匹配的记录多少—越少越好

range:这个连接类型使用索引返回一个范围中的行,比如使用>或<查找东西时发生的情况

index: 这个连接类型对前面的表中的每一个记录联合进行完全扫描(比ALL更好,因为索引一般小于表数据)

ALL:这个连接类型对于前面的每一个记录联合进行完全扫描,这一般比较糟糕,应该尽量避免




那么如何才能让sql走索引查询呢?
EXPLAIN SELECT * FROM instances WHERE id=1

技术分享
从上图可以,该sql语句走了索引。因为该表中id为主键,mysql会自动创建索引,因此当将id作为where条件查询时,数据库会自动走索引。

接下来实验,当不走索引还是查询id=1这条数据时候,会是如何?
SELECT id, display_name FROM instances WHERE id=1
技术分享

EXPLAIN SELECT * FROM instances WHERE display_name = "vm1"


技术分享


结论:在查询时候,如果where条件中的字段有索引走不走索引,取决于where条件中的字段),在执行sql语句时,mysql会自动走索引。

但是有个问题是,在走不走索引,查询花费时间都是0.001ms,似乎没有得到性能提高?
SELECT COUNT(*) FROM instances
技术分享

在数据库表中instance数据总条数才74条,因此索引没法发挥它的性能优势,接下来人为制造上w条数据:
insert instances(display_name) select display_name from instances
注:上述语句,可用来为数据库表指数形式插入新数据。
技术分享

再次查询总条数:
SELECT COUNT(*) FROM instances
技术分享

这次数据已经有接近500w了。
再次验证上述索引性能问题:

1、为了对比的真实性,将id=1的数据记录的display_name修改为唯一名字test_index_dispaly_name
SELECT id, display_name FROM instances WHERE id=1
技术分享

2、不走索引查询:
SELECT * FROM instances WHERE display_name = ‘test_index_dispaly_name‘
技术分享

3、通过id走索引查询:
SELECT * FROM instances WHERE id=1
技术分享

结论:对于百万上亿级数据,走不走索引效率影响相当明显(效率差别都到万了)。



4、哪些情况sql不会走索引?
时间关系,此处暂且未总结,后续有时间补上。若有需要请自行网上查找。

mysql优化实战(explain && 索引)