您的当前位置:首页 >人工智能 >明明是同一条SQL,为什么有时候走索引a,有时候却走索引b ? 正文
时间:2025-11-04 08:06:10 来源:网络整理编辑:人工智能
前言想象你是一家餐厅的服务员,面前有两个菜单:菜单A:按菜品分类排列前菜、主菜、甜点)菜单B:按价格从低到高排列 当顾客说:"我要最便宜的川菜"。你会:先用菜单B找到所有低价菜从中筛选川
想象你是明明一家餐厅的服务员,面前有两个菜单:菜单A:按菜品分类排列(前菜、同条主菜、什有时候甜点)菜单B:按价格从低到高排列
当顾客说:"我要最便宜的走索走索川菜"。

你会:
先用菜单B找到所有低价菜从中筛选川菜或者:
先用菜单A找到所有川菜再按价格排序这就是引a有时引MySQL优化器的日常决策!
明明是明明同一条SQL,有时候走的同条索引a,而有时候走的什有时候索引b,就是走索走索它的锅。
今天这篇文章跟大家一起聊聊,引a有时引MySQL选错索引的明明问题,希望对你会有所帮助。同条
现在有个需求:查询今年开始已付款的前100个订单。
给status字段创建了索引idx_status。走索走索
给create_time字段创建了索引idx_create_time。引a有时引
查询订单的sql如下:
复制SELECT * FROM orders WHERE status = paid -- 状态条件 AND create_time > 2025-01-01 -- 时间条件 ORDER BY amount DESC LIMIT 100;1.2.3.4.5.周一执行计划如下:
复制使用索引:idx_status(状态索引) 扫描行数:500行 耗时:0.1秒1.2.3.周二执行计划如下:
复制使用索引:idx_create_time(时间索引) 扫描行数:50万行 耗时:8秒1.2.3.周一只扫描了500行数据,而周二却扫描了50万行数据。
周一耗时0.1秒,b2b信息网而周二耗时却又8秒。
同一SQL在不同时间性能差异80倍!
让我们拆解背后的原因。
MySQL优化器的决策流程如下:
成本计算示例:
索引名称
预估扫描行数
回表次数
排序成本
总成本
idx_status
50万
50万次
需要排序
1050分
idx_create_time
5万
5万次
无需排序
600分
根据扫描行数、回表次数、排序成本,计算一个总成本的分数。
优化器会选择总成本更低的idx_create_time索引。
场景还原:
周一数据:已支付订单5万条,其中2025年的5万条周二数据:已支付订单50万条,其中2025年的50万条这个例子中数据分布变化很大,周二的数据,比周一的数据一下子多了45万。
可能会影响总成本的分数。
我们可以通过下面的SQL查看数据分布:
复制SELECT COUNT(*) AS total, SUM(status=paid) AS paid_count, SUM(create_time>2023-01-01) AS new_orders FROM orders;1.2.3.4.5. 真凶2:统计信息过期统计信息过期,就像用去年的地图导航,新修的路不会出现在地图上。服务器托管
MySQL的"地图"就是统计信息。
我们可以通过ANALYZE TABLE ... DELETE STATISTICS命令删除统计信息:
复制ANALYZE TABLE orders DELETE STATISTICS;1.这时候查询可能变成全表扫描:
复制EXPLAIN SELECT...1.显示type: ALL
那么,如何解决这个问题呢?
使用ANALYZE TABLE命令,刷新统计信息(相当于更新地图):
复制ANALYZE TABLE orders;1. 真凶3:索引覆盖度差异点餐类比:
菜单A能直接看到菜品价格 → 无需问厨师(覆盖索引)菜单B只能看到菜品名 → 需要问厨师详情(回表查询)下面的SQL会走idx_status(需要回表):
复制SELECT * FROM orders WHERE status=paid;1.下面的SQL会走idx_create_time(覆盖索引):
复制SELECT create_time FROM orders WHERE create_time>2023-01-01;1.2. 真凶4:索引碎片化索引碎片化就像书本的目录页被撕破,找内容变得困难。
检查方法:
复制SHOW TABLE STATUS LIKE orders;1.查看Data_free字段,值越大碎片越多。
优化方案:
使用ALTER TABLE命令重建索引。
复制ALTER TABLE orders ENGINE=INNODB;1.使用EXPLAIN查看当前SQL的执行计划:
复制EXPLAIN SELECT * FROM orders WHERE status=paid AND create_time>2023-01-01;1.2.3.4. 第二步:检查统计信息使用SHOW INDEX命令检查索引的统计信息:
复制SHOW INDEX FROM orders;1.关注Cardinality字段,值越接近真实数据越好。
第三步:分析数据分布使用下面的SQL分析数据分布:
复制SELECT COUNT(*) AS total, AVG(LENGTH(status)) AS status_avg_len FROM orders;1.2.3.4. 第四步:追踪优化器思考过程 复制SET optimizer_trace="enabled=on"; SELECT * FROM orders WHERE ...; SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;1.2.3.开启optimizer_trace,然后通过INFORMATION_SCHEMA.OPTIMIZER_TRACE表查看追踪优化器思考过程。
使用FORCE INDEX强制使用指定索引:
复制SELECT * FROM orders FORCE INDEX(idx_status) WHERE ...;1. 方案2:创建更优索引创建更优的联合索引:
复制ALTER TABLE orders ADD INDEX idx_status_create_time(status,create_time);1.2. 方案3:定期维护计划定期统计信息更新定期碎片率检查定期索引重建电脑赛博朋克素材教程(探索赛博朋克风格的电脑设计与创作技巧)2025-11-04 07:58
HTML5桌面通知:Notification API2025-11-04 07:43
2017年12月编程语言排行榜:年度语言候选人出炉,Kotlin与C优势很大2025-11-04 07:37
我对Go语言的错误处理有哪些不满,以及我是如何处理的2025-11-04 07:31
磁盘重新分区教程(以简单步骤了解如何重新分区您的磁盘)2025-11-04 07:25
开发者一犯再犯的15个菜鸟错误2025-11-04 06:32
曾经我创办了个公司,然后被投资人踢出去了...2025-11-04 06:28
如何用Go语言每分钟处理100万个请求2025-11-04 06:05
TCL49E5700AUD(一览TCL49E5700AUD的创新功能与卓越性能,领略智能科技的魅力)2025-11-04 05:46
详解如何使用Keras实现Wassertein GAN2025-11-04 05:33
简单高效的pe一键装机教程(零基础用户也能轻松搞定的pe装机指南)2025-11-04 07:44
如何利用C++搭建个人专属的TensorFlow2025-11-04 07:17
开源爱好者必看!开源许可证基础知识扫盲2025-11-04 07:14
手把手带你,用Python写一个Monkey自动化测试脚本!!!2025-11-04 07:08
如何使用魅蓝备份恢复出厂设置(简单操作教程帮您轻松恢复手机出厂设置)2025-11-04 06:33
NodeJs爬虫抓取古代典籍,共计16000个页面心得体会总结及项目分享2025-11-04 06:24
图例详解那道setTimeout与循环闭包的经典面试题2025-11-04 06:11
程序员经历过的最难调试的Bug是什么?2025-11-04 06:05
电脑启动错误恢复的解决方法(如何应对电脑开机后出现错误恢复的问题)2025-11-04 05:53
谷歌提出渐进式web应用开发概念,Angular Ignite UI帮程序员实现2025-11-04 05:30