mysql index subquery_[慢查优化]慎用MySQL子查询,尤其是看到DEPENDENT SUBQUERY标记时

它的执行计划如下,请注意看关键词“DEPENDENT SUBQUERY”:

id  select_type         table   type            possible_keys                           key           key_len  ref       rows  Extra

------  ------------------  ------  --------------  --------------------------------------  ------------  -------  ------  ------  -----------

1  PRIMARY             g1      index           (NULL)                                  idx_gid  5        (NULL)  850672Using where

2  DEPENDENT SUBQUERY  g2      index_subquery  id_shop_goods,idx_sid,idx_gid  idx_gid  5        func         1  Using where

基础知识:Dependent Subquery意味着什么

官方含义为:

SUBQUERY:子查询中的第一个SELECT;

DEPENDENT SUBQUERY:子查询中的第一个SELECT, 取决于外面的查询 。

换句话说,就是  子查询对 g2 的查询方式依赖于外层 g1 的查询。

什么意思呢?它意味着两步:

第一步,MySQL 根据 select gid,count(id) from shop_goods where  status=0 group by gid; 得到一个大结果集 t1,其数据量就是上图中的 rows=850672 了。

第二步,上面的大结果集 t1 中的每一条记录,都将与子查询 SQL 组成新的查询语句:select gid from shop_goods where sid in (15...blabla..29) and gid=%t1.gid%。等于说, 子查询要执行85万次……即使这两步查询都用到了索引,但不慢才怪。

如此一来, 子查询的执行效率居然受制于外层查询的记录数,那还不如拆成两个独立查询顺序执行呢。

优化策略1:

你不想拆成两个独立查询的话,也可以 与临时表联表查询,如下所示:

SELECT g1.gid,count(1)

FROM shop_goods g1, (select gid from shop_goods WHERE sid in (1519066,1466114,1466110,1466102,1466071,1453929)) g2

where g1.status=0 and  g1.gid=g2.gid

GROUP BY g1.gid;

也能得到同样的结果,且是毫秒级。

它的执行计划为:

id  select_type  table           type    possible_keys              key            key_len  ref            rows  Extra

------  -----------  --------------  ------  -------------------------  -------------  -------  -----------  ------  -------------------------------

1  PRIMARY            ALL     (NULL)                     (NULL)         (NULL)   (NULL)           30  Using temporary; Using filesort

1  PRIMARY      g1              ref     idx_gid               idx_gid   5        g2.gid       1  Using where

2  DERIVEDshop_goods  range   id_shop_goods,idx_sid  id_shop_goods  5        (NULL)           30  Using where; Using index

DERIVED 的官方含义为:

DERIVED:用于 from 子句里有子查询的情况。MySQL 会递归执行这些子查询,把结果放在临时表里。

DBA观点引用:MySQL 子查询的弱点

hidba 论述道( 参考资源3):

mysql 在处理子查询时,会改写子查询。

通常情况下,我们希望由内到外,先完成子查询的结果,然后再用子查询来驱动外查询的表,完成查询。

例如:

select * from test where tid in(select fk_tid from sub_test where gid=10)

通常我们会感性地认为该 sql 的执行顺序是:

sub_test 表中根据 gid 取得 fk_tid(2,3,4,5,6)记录,

然后再到 test 中,带入 tid=2,3,4,5,6,取得查询数据。

但是实际mysql的处理方式为:

select * from test where exists (

select * from sub_test where gid=10 and sub_test.fk_tid=test.tid

)

mysql 将会扫描 test 中所有数据,每条数据都将会传到子查询中与 sub_test 关联,子查询不会先被执行,所以如果 test 表很大的话,那么性能上将会出现问题。

《高性能MySQL》一书的观点引用

《高性能MySQL》的第4.4节“MySQL查询优化器的限制(Limitations of the MySQL Query Optimizer)”之第4.4.1小节“关联子查询(Correlated Subqueries)”也有类似的论述:

MySQL有时优化子查询很糟,特别是在WHERE从句中的IN()子查询。……

比如在sakila数据库sakila.film表中找出所有的film,这些film的actoress包括Penelope Guiness(actor_id = 1)。可以这样写:

mysql> SELECT * FROM sakila.film

-> WHERE film_id IN(

-> SELECT film_id FROM sakila.film_actor WHERE actor_id = 1);

mysql> EXPLAIN SELECT * FROM sakila.film ...;

+----+--------------------+------------+--------+------------------------+

| id | select_type        | table      | type   | possible_keys          |

+----+--------------------+------------+--------+------------------------+

| 1  | PRIMARY            | film       | ALL    | NULL                   |

| 2  |  DEPENDENT SUBQUERY | film_actor | eq_ref | PRIMARY,idx_fk_film_id |

+----+--------------------+------------+--------+------------------------+

根据EXPLAIN的输出,MySQL将全表扫描film表,对找到的每行执行子查询,这是很不好的性能。幸运的是,很容易改写为一个join查询:

mysql> SELECT film.* FROM sakila.film

-> INNER JOIN sakila.film_actor USING(film_id)

-> WHERE actor_id = 1;

另外一个方法是 通过使用GROUP_CONCAT()执行子查询作为一个单独的查询,手工产生IN()列表。有时候比join还快。(注:你不妨在我们的库上试试看 SELECT goods_id,GROUP_CONCAT(cast(id as char))

FROM bee_shop_goods

WHERE shop_id IN (1519066,1466114,1466110,1466102,1466071,1453929)

GROUP BY goods_id;)

MySQL已经因为这种特定类型的子查询执行计划而被批评。

何时子查询是好的

MySQL并不总是把子查询优化得很糟。有时候还是很优化的。下面是个例子:

mysql> EXPLAIN SELECT film_id, language_id FROM sakila.film

-> WHERE NOT EXISTS(

-> SELECT * FROM sakila.film_actor

-> WHERE film_actor.film_id = film.film_id

-> )G

……(注:具体文字还是请阅读《高性能MySQL》吧)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/557932.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java程序开发步骤

java程序开发步骤 开发环境搭建完毕后,可以开发第一个程序了 java程序开发三个步骤:编写,编译,运行。

mysql数据库rp集群_MySQL集群入门(PXC)

目标:1.掌握PXC集群MySQL方案的原理;2.掌握PXC集群的强一致性;3.掌握PXC集群的高可用方案;硬件要求:1.Win10x64企业版/linux/MacOS;2.Docker虚拟机;3.内存8GB以上;单节点数据库的弊端…

标识符、命名规则

标识符:是指在程序中,我们自己定义的内容。比如:类的名字、方法的名字和变量的名字等等; 命名规则:(硬性要求) 标识符可以包含英文字母26个(区分大小写),0-9…

ssh源码编译安装mysql_总结源码编译安装mysql

最近在学习源码编译安装LAMP、LNMP时,一直遇到一个难题,就是就是mysql无论怎么源码编译安装,到最后启动服务都提示"Starting MySQL.The server quit without updating PID file (/data/mysql/localhost.pid). [FAILED]&quo…

java中的常量

常量:在程序运行期间,固定不变的量。 常量的分类: 字符串常量:凡是用双引号引起来的部分,如:“abc”,“Hello”,“123”整数常量:直接写上的数字,没有小数点,如&#xf…

mysql blgg__MySQL_exceptions.ProgrammingError:(2014,“命令不同步;您现在无法运行此命令”)?...

-- encoding: utf-8 --db_test.pyCreated on 2019/6/25 11:14Copyright (c) 2019/6/25, 海牛学院版权所有.author: 潘牛from commons.until.db_util import DBUtilfrom configs.config import _HAINIU_DBdb_util DBUtil(_HAINIU_DB)设置字符集是utf8mb4db_util.execute_no_com…

thinkphp三级分销小程序源码_山东谷道微信小程序商城源码带后台 公众号平台三级分销系统...

山东谷道微信小程序商城源码带后台 公众号平台三级分销系统那么微信二级分销系统与微信三级分销系统到底有什么区别和联系呢?为什么改了个数字地位就天差地别?1、微信分销模式等级的区别用简洁的话来说,微信的三级分销系统包含了微信的二级分销系统,只…

linux mysql timestamp_MySQL时间类型Timestamp和Datetime 的深入理解

MySQL数据库常用的时间类型有timestamp和datetime,两者主要区别是占用存储空间长度不一致、可存储的时间也有限制,但针对不同版本下,timestamp字段类型的设置需要慎重,因为不注意的可能会被“坑死”。一、TIMESTAMP和DATETIME字段…

数字和字符对照关系表常用(编码表)

ASCII码表:美国信息交换标准代码 Unicode码表:万国码,也是数字和字符的对照关系,开头0-127部分和ASCII完全一样,但是从128开始包含更多字符。 ‘0’——48 ‘A’——65 ‘a’——97

sql express 无法启动服务_在Windows2012下安装SQL Server 2005无法启动服务的解决办法...

因为安装了Windows2012操作系统,的确很不错,唯一的遗憾就是不支持Sql Server 2005的安装。找了很多办法,基本上都有缺陷。现在终于找到一种完全正常没有缺陷的办法了,和大家分享一下。1、正常安装任一版本的SQL Server 2005.2、安…

java中运算的注意事项

运算符:进行特定操作的符号,如: 表达式:用运算符连起来的式子叫做表达式。如:205,ab 四则运算: 加: 减:- 乘:* 除:/ 取模:% 对于一个整…

ecs php mysql集成环境_在阿里云 CentOS 服务器(ECS)上搭建 nginx + mysql + php-fpm 环境...

阿里云的云服务器(ECS)可以选择多种操作系统,打算用它运行 Drupal或者 WordPress ,你最好选择 Linux 系统,这篇文章的演示是基于阿里云的 CentOS 操作系统的服务器。我们在上面搭建一个 nginx mysql php-fpm 的环境,这就是常说的…

三元运算符

一元运算符:只需要一个数据就可以进行操作的运算符,如:取反,自增 二元运算符:需要两个数据才可以进行操作的运算符,如:加,减 三元运算符:需要三个数据才可以进行操作的运…

mysql infile local,MySQL:启用LOAD DATA LOCAL INFILE

Im running Mysql 5.5 on Ubuntu 12 LTS. How should I enable LOAD DATA LOCAL INFILE in my.cnf?Ive tried adding local-infile in my config at various places but Im still getting the "The used command is not allowed with this MySQL version"解决方案Fr…

switch语句使用注意事项

语法 switch(){ case : … break; … default: break; } switch语句使用注意事项 多个case后面的数值不可以重复switch后面的小括号当中只能是下列数据类型: 基本数据类型:byte/short/char/int 引用数据类…

python函数内的作用域包括什么_python菜鸟求问关于嵌套函数中作用域范围应该怎么理解?...

直接上代码def l(list):def d():return listreturn d#运行l l([1,2,3,4])print l()这个情况是正常的。问题在于d函数为什么不能传入list,然后我现在尝试了一下这个代码:def l(list):def d(list):return listreturn d#运行l l([1,2,3,4])#提示错误print l()#正常pr…

python处理文件夹_python文件及文件夹操作

1.open()各模式详情r 以只读模式打开,没有write()方法,默认打开方式w 以只写模式打开,文件不存在时会自动创建文件,文件已存在时会清除文件内容并重建文件。这种模式打开的文件没有read()方法。a 以追加模式打…

java内存划分

java的内存需要划分成为5部分: 1. 栈(Stack):存放的都是方法中的局部变量。方法的运行一定要在栈当中运行; 局部变量:方法的参数,或者是方法{}内部的变量 作用域:一旦超出作用域&am…

iPhone的mysql客户端_适用于iPhone的MySQL C API库

我是这样做的:1)从MySQL下载Connector / C的源代码版本2)下载cmake(如果你安装了macport,输入“sudo port install cmake”)4)在模拟器的工具链文件中,从包含CMAKE_OSX_ARCHITECTURES的行中删除一个体系结构5)如果要为模拟器构建,请复制/Developer/Platforms/iPhone…

java中局部变量和成员变量

java中局部变量和成员变量 1. 定义的位置不一样 局部变量:在方法的内部 成员变量:在方法的外部,直接写在类当中 2. 作业范围不一样 局部变量:只有方法当中才能使用,出了方法就不能再用 成员变量:整个类全都…