mysql index subquery_[慢查优化]慎用MySQL子查询，尤其是看到DEPENDENT SUBQUERY标记时

它的执行计划如下，请注意看关键词“DEPENDENT SUBQUERY”：

id select_type table type possible_keys key key_len ref rows Extra

------ ------------------ ------ -------------- -------------------------------------- ------------ ------- ------ ------ -----------

1 PRIMARY g1 index (NULL) idx_gid 5 (NULL) 850672Using where

2 DEPENDENT SUBQUERY g2 index_subquery id_shop_goods,idx_sid,idx_gid idx_gid 5 func 1 Using where

基础知识：Dependent Subquery意味着什么

官方含义为：

SUBQUERY：子查询中的第一个SELECT；

DEPENDENT SUBQUERY：子查询中的第一个SELECT，取决于外面的查询。

换句话说，就是子查询对 g2 的查询方式依赖于外层 g1 的查询。

什么意思呢？它意味着两步：

第一步，MySQL 根据 select gid,count(id) from shop_goods where status=0 group by gid; 得到一个大结果集 t1，其数据量就是上图中的 rows=850672 了。

第二步，上面的大结果集 t1 中的每一条记录，都将与子查询 SQL 组成新的查询语句：select gid from shop_goods where sid in (15...blabla..29) and gid=%t1.gid%。等于说，子查询要执行85万次……即使这两步查询都用到了索引，但不慢才怪。

如此一来，子查询的执行效率居然受制于外层查询的记录数，那还不如拆成两个独立查询顺序执行呢。

优化策略1：

你不想拆成两个独立查询的话，也可以与临时表联表查询，如下所示：

SELECT g1.gid,count(1)

FROM shop_goods g1, (select gid from shop_goods WHERE sid in (1519066,1466114,1466110,1466102,1466071,1453929)) g2

where g1.status=0 and g1.gid=g2.gid

GROUP BY g1.gid;

也能得到同样的结果，且是毫秒级。

它的执行计划为：

id select_type table type possible_keys key key_len ref rows Extra

------ ----------- -------------- ------ ------------------------- ------------- ------- ----------- ------ -------------------------------

1 PRIMARY ALL (NULL) (NULL) (NULL) (NULL) 30 Using temporary; Using filesort

1 PRIMARY g1 ref idx_gid idx_gid 5 g2.gid 1 Using where

2 DERIVEDshop_goods range id_shop_goods,idx_sid id_shop_goods 5 (NULL) 30 Using where; Using index

DERIVED 的官方含义为：

DERIVED：用于 from 子句里有子查询的情况。MySQL 会递归执行这些子查询，把结果放在临时表里。

DBA观点引用：MySQL 子查询的弱点

hidba 论述道( 参考资源3)：

mysql 在处理子查询时，会改写子查询。

通常情况下，我们希望由内到外，先完成子查询的结果，然后再用子查询来驱动外查询的表，完成查询。

例如：

select * from test where tid in(select fk_tid from sub_test where gid=10)

通常我们会感性地认为该 sql 的执行顺序是：

sub_test 表中根据 gid 取得 fk_tid(2,3,4,5,6)记录，

然后再到 test 中，带入 tid=2,3,4,5,6，取得查询数据。

但是实际mysql的处理方式为：

select * from test where exists (

select * from sub_test where gid=10 and sub_test.fk_tid=test.tid

)

mysql 将会扫描 test 中所有数据，每条数据都将会传到子查询中与 sub_test 关联，子查询不会先被执行，所以如果 test 表很大的话，那么性能上将会出现问题。

《高性能MySQL》一书的观点引用

《高性能MySQL》的第4.4节“MySQL查询优化器的限制(Limitations of the MySQL Query Optimizer)”之第4.4.1小节“关联子查询(Correlated Subqueries)”也有类似的论述：

MySQL有时优化子查询很糟，特别是在WHERE从句中的IN()子查询。……

比如在sakila数据库sakila.film表中找出所有的film，这些film的actoress包括Penelope Guiness(actor_id = 1)。可以这样写：

mysql> SELECT * FROM sakila.film

-> WHERE film_id IN(

-> SELECT film_id FROM sakila.film_actor WHERE actor_id = 1);

mysql> EXPLAIN SELECT * FROM sakila.film ...;

+----+--------------------+------------+--------+------------------------+

+----+--------------------+------------+--------+------------------------+

+----+--------------------+------------+--------+------------------------+

根据EXPLAIN的输出，MySQL将全表扫描film表，对找到的每行执行子查询，这是很不好的性能。幸运的是，很容易改写为一个join查询：

mysql> SELECT film.* FROM sakila.film

-> INNER JOIN sakila.film_actor USING(film_id)

-> WHERE actor_id = 1;

另外一个方法是通过使用GROUP_CONCAT()执行子查询作为一个单独的查询，手工产生IN()列表。有时候比join还快。(注：你不妨在我们的库上试试看 SELECT goods_id,GROUP_CONCAT(cast(id as char))

FROM bee_shop_goods

WHERE shop_id IN (1519066,1466114,1466110,1466102,1466071,1453929)

GROUP BY goods_id;)

MySQL已经因为这种特定类型的子查询执行计划而被批评。

何时子查询是好的

MySQL并不总是把子查询优化得很糟。有时候还是很优化的。下面是个例子：

mysql> EXPLAIN SELECT film_id, language_id FROM sakila.film

-> WHERE NOT EXISTS(

-> SELECT * FROM sakila.film_actor

-> WHERE film_actor.film_id = film.film_id

-> )G

……(注：具体文字还是请阅读《高性能MySQL》吧)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/557932.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

mysql index subquery_[慢查优化]慎用MySQL子查询，尤其是看到DEPENDENT SUBQUERY标记时

相关文章

java程序开发步骤

mysql数据库rp集群_MySQL集群入门（PXC）

标识符、命名规则

ssh源码编译安装mysql_总结源码编译安装mysql

java中的常量

mysql blgg__MySQL_exceptions.ProgrammingError：(2014，“命令不同步；您现在无法运行此命令”)？...

thinkphp三级分销小程序源码_山东谷道微信小程序商城源码带后台公众号平台三级分销系统...

linux mysql timestamp_MySQL时间类型Timestamp和Datetime 的深入理解

数字和字符对照关系表常用（编码表）

sql express 无法启动服务_在Windows2012下安装SQL Server 2005无法启动服务的解决办法...

java中运算的注意事项

ecs php mysql集成环境_在阿里云 CentOS 服务器（ECS）上搭建 nginx + mysql + php-fpm 环境...

三元运算符

mysql infile local,MySQL：启用LOAD DATA LOCAL INFILE

switch语句使用注意事项

python函数内的作用域包括什么_python菜鸟求问关于嵌套函数中作用域范围应该怎么理解？...

python处理文件夹_python文件及文件夹操作

java内存划分

iPhone的mysql客户端_适用于iPhone的MySQL C API库

java中局部变量和成员变量