首页 > 代码库 > 优化SQL的执行速度
优化SQL的执行速度
在项目开发中,页面的反应速度是非常重要的,改善页面反应速度的方法有很多。
但一般的问题多数是出现在数据库访问的SQL上面。
比如:重复多次访问数据库,SQL速度很低等。
重复多次访问数据库需要修改逻辑来减少数据库的访问。而SQL的执行速度可以通过仔细调试解决。
下面是一些SQL的性能调试方法.整理于网络内容。
1. IN和EXISTS
--1.慢 SELECT name FROM Personnel WHERE birthday IN (SELECT birthday FROM Celebrities); --2.快 SELECT P.name FROM Personnel AS P WHERE EXISTS (SELECT FROM Clelebrities AS C WHERE P.birthday = C.birthday);
其中EXISTS (SELECT * FROM …)的写法比EXISTS (SELECT 列名 FROM …)的写法好。
2. COUNT(*) 和 COUNT(列名)
COUNT(列名)较快
3. GROUP BY 使用index。
GROUP BY col1 如果不能使用index。 GROUP BY col1,col2能够使用index的话,改为 GROUP BY col1,col2。
4. ORDER BY 使用index。
和GROUP BY同理。
5. UNION、INTERSECT、EXCEPT 后面加上ALL 关键字
如果对重复数据不是很敏感的时候,在UNION、INTERSECT、EXCEPT 后面加上ALL 关键字后,性能会得到提升。
6. 下面的一些写法也会造成使用了index。
/* 1.index的col_1列有运算 */ SELECT * FROM SomeTable WHERE col_1 * 1.1 > 100;
这种情况改为 WHERE col_1 > 100/1.1即可。
WHERE col_1 IS NULL;
使用了is null的时候也是使用不了index的。这个时候可以做个函数index来解决。
WHERE SUBSTR(col_1, 1, 1) = ‘a‘;
index的列使用了函数。这个时候可以做个函数index来解决。
WHERE col_1 <> 100;
使用了否定形式。 (<>, !=,NOT EQUAL, NOT IN)也是一样的。
比如通过 col_1 < 100 OR col_1 > 100这种变换的形式来解决。
WHERE col_1 > 100 OR col_2 = ‘abc‘;
OR的时候最好改为in。 如果非要使用OR的话,追加bitmap index。
× SELECT * FROM SomeTable WHERE col_1 LIKE ‘%a‘; × SELECT * FROM SomeTable WHERE col_1 LIKE ‘%a%‘; ○ SELECT * FROM SomeTable WHERE col_1 LIKE ‘a%‘;
Like的时候,只有前方一致能够使用index。
后方一致可以通过REVERSE转换后,改为前方一致就可以了。部分一致可以写个函数,追加函数index就可以了。
SELECT * FROM SomeTable WHERE col_1 = 10; SELECT * FROM SomeTable WHERE col_1 = ‘10‘; SELECT * FROM SomeTable WHERE col_1 = CAST(10, AS CHAR(2));
col_1为char类型,类型不匹配的时候,不能使用index。改为类型一致。
○ SELECT * FROM SomeTable WHERE col_1 = 10 AND col_2 = 100 AND col_3 = 500; ○ SELECT * FROM SomeTable WHERE col_1 = 10 AND col_2 = 100 ; × SELECT * FROM SomeTable WHERE col_1 = 10 AND col_3 = 500 ; × SELECT * FROM SomeTable WHERE col_2 = 100 AND col_3 = 500 ; × SELECT * FROM SomeTable WHERE col_2 = 100 AND col_1 = 10 ;
假设col_1, col_2, col_3 列上有index,如果顺序不对的话不能使用index。
rowid(Oracle)、oid(PostgreSQL)如果知道行号的话,行号访问最快。
× SELECT * FROM SomeTable; ○ SELECT col_1, col_2, col_3 FROM SomeTable;
最好只取需要的数据。这样可以减少零时表的大小,也能减少网络的通信量。