数据库
首页 > 数据库> > MySQL 优化特定类型的查询

MySQL 优化特定类型的查询

作者:互联网

优化COUNT()查询

COUNT() 是一个特殊的函数,有两种非常不同的作用:
统计某个列值的数量,也可以统计行数。在统计列值时要求列值是非空的(不统计NULL )。如果在COUNT() 的括号中指定了列或者列的表达式,则统计的就是这个表达式有值的结果数。
另一个作用是统计结果集的行数,当MySQL确认括号内的表达式值不可能为空时,实际上就是在统计行数,最简单的就是当我们使用COUNT(*) 的时候。
通常来说,COUNT() 都需要扫描大量的行(意味着要访问大量数据)才能获得精确的结果,因此是很难优化的。除了简单的优化和使用近似值,在MySQL层面还能做的就只有索引覆盖扫描了

优化关联查询

确保ON 或者USING 子句中的列上有索引。
确保任何的GROUP BY 和ORDER BY 中的表达式只涉及到一个表中的列,这样MySQL才有可能使用索引来优化这个过程。

优化GROUP BY 和DISTINCT

在很多场景下,MySQL都使用同样的办法优化这两种查询。它们都可以使用索引来优化,这也是最有效的优化办法。当无法使用索引的时候,GROUP BY 使用两种策略来完成:使用临时表或者文件排序来做分组。如果没有通过ORDER BY 子句显式地指定排序列,当查询使用GROUP BY子句的时候,结果集会自动按照分组的字段进行排序。如果不关心结果集的顺序,而这种默认排序又导致了需要文件排序,则可以使用ORDER BY NULL ,让MySQL不再进行文件排序。也可以在GROUP BY子句中直接使用DESC或者ASC关键字,使分组的结果集按需要的方向排序。

优化LIMIT分页

在系统中需要进行分页操作的时候,我们通常会使用LIMIT 加上偏移量的办法实现,同时加上合适的ORDER BY 子句。如果有对应的索引,通常效率会不错,否则,MySQL需要做大量的文件排序操作。
在偏移量非常大的时候,例如LIMIT 10000,20 这样的查询,这时MySQL需要查询10 020条记录然后只返回最后20条,前面10000条记录都将被抛弃,这样的代价非常高。
优化这种查询,要么是在页面中限制分页的数量,要么是优化大偏移量的性能。一个最简单的办法就是尽可能地使用索引覆盖扫描,而不是查询所有的列。然后根据需要做一次关联操作再返回所需的列。观察下面的查询:
mysql> SELECT film_id, description FROM sakila.film ORDER BY title LIMIT 50, 5;
在表数据量较大时,最好改写为:

SELECT film.film_id, film.description
FROM sakila.film
INNER JOIN (
SELECT film_id FROM sakila.film
ORDER BY title LIMIT 50, 5
) AS lim USING(film_id);

这里的延迟关联将大大提升查询效率,它让MySQL扫描尽可能少的页面,获取需要访问的记录后再根据关联列回原表查询需要的所有列。这个技术也可以用于优化关联查询中的LIMIT 子句。

优化UNION查询

MySQL总是通过创建并填充临时表的方式来执行UNION 查询,除非确实需要服务器消除重复的行,否则就一定要使用UNION ALL,这一点很重要。如果没有ALL关键字,MySQL会给临时表加上DISTINCT 选项,这会导致对整个临时表的数据做唯一性检查。

统计更新和插入的数量

当使用了INSERT ON DUPLICATE KEY UPDATE 的时候,如果想知道到底插入了多少行数据,到底有多少数据是因为冲突而改写成更新操作的?一个方法如下:

INSERT INTO t1(c1, c2) VALUES(4, 4), (2, 1), (3, 1)
 ON DUPLICATE KEY UPDATE
 c1 = VALUES(c1) + ( 0 * ( @x := @x +1 ) );

更快地读,更慢地写

为了提升读查询的速度,经常会需要建一些额外索引,增加冗余列,甚至是创建缓存表和汇总表。这些方法会增加写查询的负担,也需要额外的维护任务,但在设计高性能数据库时,这是常见的技巧:虽然写操作变得更慢了,但更显著地提高了读操作的性能。

标签:查询,索引,LIMIT,MySQL,优化,film
来源: https://www.cnblogs.com/cd-along/p/15008417.html