【性能优化】MySQL 生产环境 SQL 性能优化实战案例

🚀 MySQL 生产环境 SQL 性能优化实战案例

🏗️ 背景介绍

最近在处理一个项目时,发现在生产环境的工作流相关接口中,某些查询的执行时间异常缓慢,尽管数据量仅为 2 万条。经过分析,发现以下 SQL 语句执行非常慢:

SELECT *
FROM ACT_HI_TASKINST t
LEFT JOIN ACT_HI_PROCINST p ON p.PROC_INST_ID_ = t.PROC_INST_ID_
LEFT JOIN ACT_HI_COMMENT c ON c.TASK_ID_ = t.id_;

尤其是在添加 LEFT JOIN ACT_HI_COMMENT 后,查询时间显著增加,达到了 ⏳ 1 分钟。我们需要深入分析并优化此查询。

🔍 执行计划分析

通过 EXPLAIN FORMAT=JSON 分析执行计划,得到的关键结果如下:

  • c 表有 23,754 行,但 rows_produced_per_join 却达到了 4.19 亿 行,产生了 笛卡尔积效应 💥。
  • data_read_per_join 高达 5TB,导致查询执行极为缓慢 🐌。
  • JOIN 方式为 Block Nested Loop(BNL),执行效率较低。
  • TASK_ID_ 字段缺乏合适的索引,导致 c 表进行全表扫描 📜。

执行计划示例:

{"query_block": {"select_id": 1,"cost_info": {"query_cost": "86412925.39"},"nested_loop": [{"table": {"table_name": "t","access_type": "ALL","rows_examined_per_scan": 17679,"rows_produced_per_join": 17679,"filtered": "100.00","cost_info": {"read_cost": "419.00","eval_cost": "3535.80","prefix_cost": "3954.80","data_read_per_join": "567M"},"used_columns": ["ID_","REV_","PROC_DEF_ID_","TASK_DEF_ID_","TASK_DEF_KEY_","PROC_INST_ID_","EXECUTION_ID_","SCOPE_ID_","SUB_SCOPE_ID_","SCOPE_TYPE_","SCOPE_DEFINITION_ID_","NAME_","PARENT_TASK_ID_","DESCRIPTION_","OWNER_","ASSIGNEE_","START_TIME_","CLAIM_TIME_","END_TIME_","DURATION_","DELETE_REASON_","PRIORITY_","DUE_DATE_","FORM_KEY_","CATEGORY_","TENANT_ID_","LAST_UPDATED_TIME_"]}},{"table": {"table_name": "p","access_type": "eq_ref","possible_keys": ["PROC_INST_ID_"],"key": "PROC_INST_ID_","used_key_parts": ["PROC_INST_ID_"],"key_length": "194","ref": ["work_order.t.PROC_INST_ID_"],"rows_examined_per_scan": 1,"rows_produced_per_join": 17679,"filtered": "100.00","cost_info": {"read_cost": "17679.00","eval_cost": "3535.80","prefix_cost": "25169.60","data_read_per_join": "319M"},"used_columns": ["ID_","REV_","PROC_INST_ID_","BUSINESS_KEY_","PROC_DEF_ID_","START_TIME_","END_TIME_","DURATION_","START_USER_ID_","START_ACT_ID_","END_ACT_ID_","SUPER_PROCESS_INSTANCE_ID_","DELETE_REASON_","TENANT_ID_","NAME_","CALLBACK_ID_","CALLBACK_TYPE_"]}},{"table": {"table_name": "c","access_type": "ALL","rows_examined_per_scan": 23754,"rows_produced_per_join": 419946966,"filtered": "100.00","using_join_buffer": "Block Nested Loop","cost_info": {"read_cost": "2398362.59","eval_cost": "83989393.20","prefix_cost": "86412925.39","data_read_per_join": "5T"},"used_columns": ["ID_","TYPE_","TIME_","USER_ID_","TASK_ID_","PROC_INST_ID_","ACTION_","MESSAGE_","FULL_MSG_"],"attached_condition": "<if>(is_not_null_compl(c), (work_order.c.TASK_ID_ = work_order.t.ID_), true)"}}]}
}

⚡ 优化方案

✅ 1. 增加索引

c.TASK_ID_ 添加索引,以减少全表扫描带来的影响:

ALTER TABLE ACT_HI_COMMENT ADD INDEX idx_comment_task (TASK_ID_);

🔄 2. 重新分析执行计划

索引添加后,c 表的 rows_produced_per_join4.19 亿 降至 24,421,查询方式变为 ref(通过索引查找),扫描行数大幅减少 📉。

优化后的执行计划示例:

{"query_block": {"select_id": 1,"cost_info": {"query_cost": "54475.04"},"nested_loop": [{"table": {"table_name": "t","access_type": "ALL","rows_examined_per_scan": 17679,"rows_produced_per_join": 17679,"filtered": "100.00","cost_info": {"read_cost": "419.00","eval_cost": "3535.80","prefix_cost": "3954.80","data_read_per_join": "567M"},"used_columns": ["ID_","REV_","PROC_DEF_ID_","TASK_DEF_ID_","TASK_DEF_KEY_","PROC_INST_ID_","EXECUTION_ID_","SCOPE_ID_","SUB_SCOPE_ID_","SCOPE_TYPE_","SCOPE_DEFINITION_ID_","NAME_","PARENT_TASK_ID_","DESCRIPTION_","OWNER_","ASSIGNEE_","START_TIME_","CLAIM_TIME_","END_TIME_","DURATION_","DELETE_REASON_","PRIORITY_","DUE_DATE_","FORM_KEY_","CATEGORY_","TENANT_ID_","LAST_UPDATED_TIME_"]}},{"table": {"table_name": "p","access_type": "eq_ref","possible_keys": ["PROC_INST_ID_"],"key": "PROC_INST_ID_","used_key_parts": ["PROC_INST_ID_"],"key_length": "194","ref": ["work_order.t.PROC_INST_ID_"],"rows_examined_per_scan": 1,"rows_produced_per_join": 17679,"filtered": "100.00","cost_info": {"read_cost": "17679.00","eval_cost": "3535.80","prefix_cost": "25169.60","data_read_per_join": "319M"},"used_columns": ["ID_","REV_","PROC_INST_ID_","BUSINESS_KEY_","PROC_DEF_ID_","START_TIME_","END_TIME_","DURATION_","START_USER_ID_","START_ACT_ID_","END_ACT_ID_","SUPER_PROCESS_INSTANCE_ID_","DELETE_REASON_","TENANT_ID_","NAME_","CALLBACK_ID_","CALLBACK_TYPE_"]}},{"table": {"table_name": "c","access_type": "ref","possible_keys": ["idx_comment_task"],"key": "idx_comment_task","used_key_parts": ["TASK_ID_"],"key_length": "195","ref": ["work_order.t.ID_"],"rows_examined_per_scan": 1,"rows_produced_per_join": 24421,"filtered": "100.00","cost_info": {"read_cost": "24421.20","eval_cost": "4884.24","prefix_cost": "54475.04","data_read_per_join": "347M"},"used_columns": ["ID_","TYPE_","TIME_","USER_ID_","TASK_ID_","PROC_INST_ID_","ACTION_","MESSAGE_","FULL_MSG_"]}}]}
}

优化后,查询时间从 ⏳ 1 分钟 降至毫秒级 🚀,性能得到了显著提升。

🔬 MySQL 8 本地测试情况

在 MySQL 8 本地环境进行测试时,原 SQL 语句的执行时间没有出现明显的性能问题,可能原因包括:

  • 优化器改进:MySQL 8 对 JOIN 方式进行了优化,减少了 BNL 的使用。
  • 更智能的默认索引策略:MySQL 8 在索引选择上更为智能,避免了不必要的全表扫描。
  • 测试环境数据量较小:由于本地环境数据较少,无法重现生产环境中的慢查询问题。

尽管在本地 MySQL 8 上运行正常,我们仍建议在生产环境中进行 EXPLAIN 分析,以确保优化方案的有效性。

MySQL 8.0 中引入了 Hash Join 自动选择,取代了传统的 Nested Loop Join(嵌套循环连接)。执行计划中的 "using_join_buffer": "hash join" 证实了这一点。Hash Join、并行查询和 Buffer Pool 的优化是导致问题未能在本地复现的主要原因。因此,最终我们通过与生产环境完全一致的数据库版本和配置复现了问题。

执行计划:

{"query_block": {"select_id": 1,"cost_info": {"query_cost": "36941768.34"},"nested_loop": [{"table": {"table_name": "t","access_type": "ALL","rows_examined_per_scan": 16978,"rows_produced_per_join": 16978,"filtered": "100.00","cost_info": {"read_cost": "104.75","eval_cost": "1697.80","prefix_cost": "1802.55","data_read_per_join": "544M"},"used_columns": ["ID_","REV_","PROC_DEF_ID_","TASK_DEF_ID_","TASK_DEF_KEY_","PROC_INST_ID_","EXECUTION_ID_","SCOPE_ID_","SUB_SCOPE_ID_","SCOPE_TYPE_","SCOPE_DEFINITION_ID_","NAME_","PARENT_TASK_ID_","DESCRIPTION_","OWNER_","ASSIGNEE_","START_TIME_","CLAIM_TIME_","END_TIME_","DURATION_","DELETE_REASON_","PRIORITY_","DUE_DATE_","FORM_KEY_","CATEGORY_","TENANT_ID_","LAST_UPDATED_TIME_"]}},{"table": {"table_name": "p","access_type": "eq_ref","possible_keys": ["PROC_INST_ID_"],"key": "PROC_INST_ID_","used_key_parts": ["PROC_INST_ID_"],"key_length": "194","ref": ["work_order.t.PROC_INST_ID_"],"rows_examined_per_scan": 1,"rows_produced_per_join": 16978,"filtered": "100.00","cost_info": {"read_cost": "4244.50","eval_cost": "1697.80","prefix_cost": "7744.85","data_read_per_join": "306M"},"used_columns": ["ID_","REV_","PROC_INST_ID_","BUSINESS_KEY_","PROC_DEF_ID_","START_TIME_","END_TIME_","DURATION_","START_USER_ID_","START_ACT_ID_","END_ACT_ID_","SUPER_PROCESS_INSTANCE_ID_","DELETE_REASON_","TENANT_ID_","NAME_","CALLBACK_ID_","CALLBACK_TYPE_"]}},{"table": {"table_name": "c","access_type": "ALL","rows_examined_per_scan": 21447,"rows_produced_per_join": 364127166,"filtered": "100.00","using_join_buffer": "hash join","cost_info": {"read_cost": "521306.89","eval_cost": "36412716.60","prefix_cost": "36941768.34","data_read_per_join": "4T"},"used_columns": ["ID_","TYPE_","TIME_","USER_ID_","TASK_ID_","PROC_INST_ID_","ACTION_","MESSAGE_","FULL_MSG_"],"attached_condition": "<if>(is_not_null_compl(c), (`work_order`.`c`.`TASK_ID_` = `work_order`.`t`.`ID_`), true)"}}]}
}

🎯 结论

  • 问题根因:缺少合适的索引,导致 MySQL 使用 BNL 方式进行 JOIN,引发巨量扫描。
  • 优化措施:为 TASK_ID_ 添加索引,使得 c 表的访问方式从 ALL 变为 ref,减少了扫描行数。
  • 最终效果:查询时间从 ⏳ 1 分钟 降至毫秒级 🎉。

📌 建议

  • 📊 定期检查慢查询日志,及时优化 SQL 语句。
  • 🛠️ 合理设计索引,避免全表扫描。
  • 🧐 使用 EXPLAIN 分析执行计划,确保查询能够利用索引路径。

希望本文中的优化过程能对你在 MySQL 生产环境中的性能调优有所帮助!🎯💡


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/73487.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python速通小笔记-------1.容器

1.字符串的标识 字符串需要用“”标识。 与c不同&#xff0c;python 写变量时 不需要标明数据类型每一行最后不需要加&#xff1b; 2.print函数的使用 与c中的printf函数一致 3.运算符 4.字符串str操作 1. 实现字符串拼接 2.% 实现字符串初始化 %s占位会把变量强制转变为…

【SpringMVC】常用注解:@SessionAttributes

1.作用 用于多次执行控制器方法间的参数共享 2.属性 value&#xff1a;用于指定存入的属性名称 type&#xff1a;用于指定存入的数据类型 3.示例 先写JSP代码 <a href"demo1/putMethod">存入 SessionAttribute</a><br><a href"demo…

零基础上手Python数据分析 (2):Python核心语法快速入门

写在前面 场景:每周销售数据报表整理 任务描述: 你需要每周从多个Excel文件中汇总销售数据,计算各项指标(销售额、订单量、客单价等),并生成周报。Excel操作痛点: 文件太多,手动打开复制粘贴,效率低下,容易出错。 多个Excel文件,每个都要打开、筛选、复制数据,重复…

【PHP】获取PHP-FPM的状态信息

文章目录 一、前言二、环境三、过程1&#xff09;修改PHP-FPM配置文件2&#xff09;修改Nginx配置文件3&#xff09;访问页面4&#xff09;修改状态页面端口 一、前言 PHP-FPM内置有一个状态页面&#xff0c;通过这个页面可以获取到FPM的一些状态信息&#xff08;见下图&#…

CCF CSP 第30次(2023.09)(2_坐标变换(其二)_C++)

CCF CSP 第30次&#xff08;2023.09&#xff09;&#xff08;2_坐标变换&#xff08;其二&#xff09;_C&#xff09; 题目背景&#xff1a;题目描述&#xff1a;输入格式&#xff1a;输出格式&#xff1a;样例输入&#xff1a;样例输出&#xff1a;样例解释&#xff1a;子任务…

搭建Spring Boot Admin监控系统

什么是Spring Boot Admin Spring Boot Admin 是一个用于管理和监控 Spring Boot 应用程序的开源工具。它提供了一个用户友好的 Web 界面&#xff0c;用于集中管理和监控多个 Spring Boot 应用程序的运行状态、健康状况、日志、配置等信息。 Spring Boot Admin 的核心功能 应用…

机器学习中的激活函数是什么起什么作用

在机器学习&#xff0c;尤其是神经网络中&#xff0c;​激活函数​&#xff08;Activation Function&#xff09;是一个非常重要的组件。它的主要作用是为神经网络引入非线性&#xff0c;从而使神经网络能够学习和表示复杂的模式或函数。 1.激活函数的定义 激活函数是一个数学…

[CISCN 2022 初赛]ezpop(没成功复现)

打开在线环境可以看到&#xff1a; 记得之前做过一个类似的就是有点像照着漏洞去复现。应该可以直接在网上找到链子去打。 www.zip查看路由是 Index/test&#xff0c;然后 post 传参 a&#xff1a; exp&#xff08;参考了别的大神的wp&#xff09;&#xff1a; <?php //…

C 语 言 --- 二 维 数 组 的 应 用

C 语 言 --- 二 维 数 组 的 应 用 第 一 题 - - - 冒 泡 排 序冒 泡 排 序冒 泡 排 序 的 原 理 第 二 题 - - - 回 型 矩 阵特 点 第 三 题 - - - 蛇 形 矩 阵总结 &#x1f4bb;作者简介&#xff1a;曾 与 你 一 样 迷 茫&#xff0c;现 以 经 验 助 你 入 门 C 语 言 &…

5G核心网实训室搭建方案:轻量化部署与虚拟化实践

5G核心网实训室 随着5G技术的广泛应用&#xff0c;行业对于5G核心网人才的需求日益增长。高校、科研机构和企业纷纷建立5G实训室&#xff0c;以促进人才培养、技术创新和行业应用研究。IPLOOK凭借其在5G核心网领域的深厚积累&#xff0c;提供了一套高效、灵活的5G实训室搭建方…

寄生虫仿生算法:基于寄生虫特征的算法设计

寄生虫仿生算法:基于寄生虫特征的算法设计 基于寄生虫行为特征的仿生算法设计 import random import numpy as npclass EnhancedPBOA:def __init__(self, host_env, max_generations, population_size50):self.host_env host_envself.max_generations max_generationsself.p…

【医学影像 AI】基于深度学习的 ROP 病变检测图像评估系统

【医学影像 AI】基于深度学习的 ROP 病变检测图像评估系统 0. 论文简介0.1 基本信息0.2 摘要 1. 引言2. 材料与方法2.1 研究人群2.2 疾病分类与参考标准的制定2.3 深度学习系统开发2.4 定量严重程度评分2.5 数据分析 3. 结果4. 讨论6. 参考文献 0. 论文简介 0.1 基本信息 201…

当AI学会“察言观色“:多模态情绪识别的魔幻现实主义之旅

引言&#xff1a;AI读脸时代的荒诞与真实 2025年的某个深夜&#xff0c;程序员小李开发的"情绪识别AI"把老板的假笑误判为"愤怒"&#xff0c;导致全员收到《关于禁止皮笑肉不笑的通知》。这场乌龙揭开了单模态识别的遮羞布——原来AI和人一样&#xff0c…

Cursor初体验:excel转成CANoe的vsysvar文件

今天公司大佬先锋们给培训了cursor的使用&#xff0c;还给注册了官方账号&#xff01;跃跃欲试&#xff0c;但是测试任务好重&#xff0c;结合第三方工具开发也是没有头绪。 但巧的是&#xff0c;刚好下午有同事有个需求&#xff0c;想要把一个几千行的excel转成canoe的系统变…

每日一题---单词搜索(深搜)

单词搜索 给出一个二维字符数组和一个单词&#xff0c;判断单词是否在数组中出现&#xff0c; 单词由相邻单元格的字母连接而成&#xff0c;相邻单元指的是上下左右相邻。同一单元格的字母不能多次使用。 数据范围&#xff1a; 0 < 行长度 < 100 0 < 列长度 <…

【深度学习】多源物料融合算法(一):量纲对齐常见方法

目录 一、引言 二、量纲对齐常见方法 2.1 Z-score标准化Sigmoid归一化 2.2 Min-Max 归一化 2.3 Rank Transformation 2.4 Log Transformation 2.5 Robust Scaling 3、总结 一、引言 类似抖音、快手、小红书等产品的信息流推荐业务&#xff0c;主要通过信息流广告、信…

deepseek为什么要开源

一、生态位的抢占与锁定&#xff1a;以 JDK 版本为例​ 在软件开发的世界里&#xff0c;生态位的抢占和先入为主的效应十分显著。就拿 Java 开发中的 JDK 版本来说&#xff0c;目前大多数开发者仍在广泛使用 JDK8。尽管 JDK17 和 JDK21 已经推出&#xff0c;且具备更多先进特性…

【AI】内容生成式AI(AIGC)的深度分析与扩展

引言 随着人工智能&#xff08;AI&#xff09;技术的迅速发展&#xff0c;AI生成内容&#xff08;AIGC&#xff09;已经在多个领域表现出巨大潜力&#xff0c;改变了内容创作的方式。这篇文章将详细介绍AI生成内容的技术原理、应用领域、优缺点、未来趋势以及相关伦理问题&…

用C++新建快捷方式

1.创建文件 新建一个文件Ink.cpp,系统会自动生成对应的EXE文件 2.编写代码 #include<stdlib.h> int main(){ system("powershell -command \"$WshShellNew-Object -comObject WScript.Shell; $Shortcut$WshShell.CreateShortcut(\%UserProfile%\\Desktop\\1.…

前端Html5 Canvas面试题及参考答案

目录 Canvas 元素的默认尺寸是多少?如何正确设置其宽高以避免图像拉伸? 如何获取 Canvas 的 2D 上下文对象?3D 上下文支持哪些技术? canvas.width 与 canvas.style.width 的区别是什么? Canvas 支持的图像格式有哪些?如何将 Canvas 转换为 Base64 图片? Canvas 中如…