首页 > 代码库 > MySQL使用与优化总结1

MySQL使用与优化总结1

 

内容来自  http://my.oschina.net/u/142836/blog/169415

使用与优化

DB的优化

建立合适的索引:

尽量让所有查询都走索引,这个效果是很明显的。

表空间优化

在删除或更新比较频繁的表上,如果包含varchar,text之类的字段,需要定期地执行表空间优化,optimaize table xxx,整理磁盘碎片,回收表数据和索引数据占用的空闲空间;

配置参数优化

innodb_buffer_pool_size innodb表数据和索引数据的内存缓冲大小,很关键,可以有效减少磁盘IO。innodb_flush_log_at_trx_commit 决定事务日志怎么记录,这个对性能提升也很关键,在线下批量写数据时可以考虑设置为0.或者写操作频繁但允许故障时丢失极少量数据的情况也可以考虑。
query_cache 这个参数有些微妙,因为query cache在数据表中有任何数据修改时就会失效,对于写操作频繁的表来说,有可能还会降低性能。对于读操作为主的表来说,效果还是很明显的,但是通常场景下我们都依赖于前端缓存,所以对于这个参数的设置来说,还要看具体业务场景。
max_connections 控制并发连接数,不能太大,否则后果很严重。

拆分与扩容:

库拆分:一般是把同一实例上的数据库分到多个实例上来分担压力(这种比较简单,做一份复制,应用端改个ip就行),或者是把一个库里面的部分表单独放到另一个实例库中(这种比较麻烦,需要应用端配合修改程序)。
表拆分:也分两种,一种是把一些字段的拆出到新表里,比如按业务分,或者是像text之类的大字段拆分。另一种是表记录数太大,超出了单表承受能力,需要水平扩展到多张表。表拆分比较麻烦,都需要应用端配合修改程序。


SQL的优化

尽量用上索引,能用主键查询最好了
尽量缩小扫描范围,经典场景就是limit分页偏移量的优化,其实在实际业务场景下很有很多类似的场景,我们完全可以按id号或者时间限制来显著缩小查询扫描范围
尽量减少表连接查询,最好是单表查询(表连接可能用上临时表,对DB消耗很大;而单表查询可以快速返回,把计算操作放到前端应用去做,减少DB压力)。如果前端并发没有控制好的话,性能较差的表连接查询可能会拖死DB
尽量做等值查询,不等条件查询和逆向查询不走索引
用union替代or、in操作
不做前置模糊查询,不走索引
排序和分组操作尽量在应用端做,减少DB的CPU压力
在查询列上不作函数运算:select concat(‘foo‘,‘bar‘) as str from xxx;


应用的优化

尽量不在DB端做运算,能在应用端做的事就不依赖DB
text/blob之类的数据尽量不在DB中存储,可以采用其它key/value型的存储
大sql拆分成小sql查,不做表连接
用好连接池,减少连接开销(这里要注意连接池的空闲时间与数据库空闲时间的配置)
有冷热数据的场景,尽量均摊压力
考虑读写分离(这里要注意slave的延时,master写频繁的情况下,slave延时也是另人很头疼的,对数据一致性敏感的应用场景是有隐患的)
最后提一下,preparedstatement,最大的作用是防止SQL注入。预编译功能也可以尝试使用,但是要开启前端sql缓存才好,这个还是看具体应用场景吧,大多数互联网应用还没到靠这个功能来提升性能的情况。


简单故障排查技巧

慢查询排查

日志查看:slow.log,这个是mysql配置文件里设置的,要开启。

实时查看:select * from information_schema.processlist where time > 2;

处理方式:

慢查询日志分析工具:mysqlsla,mysqldumpslow等,对症下药进行SQL优化;

实时的慢查询如果影响了应用的响应,可以直接kill掉查询线程。执行kill [thread_id]即可。

Lock情况排查

确定数据库有锁住情况看两个地方,在processlist中可以看到state那一列有lock相关的状态,这里只能看到一个状态,最主要是通过下面这个命令来查看show innodb engine status,这里会显示详细的锁和事务发生的信息。至于怎么解决,要看应用端怎么来控制了。

Slave延时排查

在slave实例上执行show slave status查看slave的状态,主要关注以下三个:

Slave_IO_Running: Yes // 负责读取binlog的线程是否正常运行
Slave_SQL_Running: Yes // 负责在slave上执行sql的线程是否正常运行
Seconds_Behind_Master: 0 // slave比master延时多长时间,单位:秒
如果出现IO和SQL线程状态为No的情况,那说明slave同步已经停止了,可以通过Last_Error这个看到最近的错误。如果要恢复slave,一般两种操作:一是重做slave,保证数据更准确;一种是跳过出错的sql,stop slave;set global sql_slave_skip_counter=1;start slave;,这是跳过一条sql,也可跳过多条,这种方式可能导致slave数据不一致。

监控

内置命令
status
show global status
show variables
外部监控
第三方的监控工具,可以提供图形化的界面。cacti,ganglia等开源软件都提供了监控mysql的插件。

简单说说mysql高可用

两种方式:
方式一:使用MySQL Cluster:读扩展性好,写性能会有一定下降。不是很成熟,线上慎用。
方式二:Master + Slave配合虚拟IP + LVS + keepalived实现简单的高可用,这种方案的隐患就是:虚拟ip切换间隙会有短暂不可用;slave提升到master会有失败的情况;
最后
数据库一般都存储了应用的关键数据,可以说是一个公司产品的生命,所以数据的安全也非常重要,要做好权限控制(严格控制权限,尽量防止误操作造成数据丢失),及时备份数据(异地,多机房),对于核心敏感数据还要做好保密工作。

推荐阅读:  

MySQL使用与优化总结1