问:SQL优化,七条实践总结?

SQL语句优化是数据库性能调优的重要部分,通过合理的优化可以显著提升查询速度和系统性能。文章总结几种常见SQL语句优化方法。

1. 优化Where子句的顺序

原则:表之间的连接条件应写在其他Where条件之前,能够过滤掉最大数量记录的条件应优先写。

解释:数据库在执行查询时,会按照Where子句中的条件顺序进行过滤。如果最先执行的是最能缩小结果集的条件,那么后续的处理量将会大大减少,从而提高查询效率。

示例

-- 不优化的写法
SELECT * 
FROM orders o
WHERE o.order_date > '2023-01-01' AND o.customer_id = c.id AND c.region = 'North';-- 优化的写法
SELECT * 
FROM orders o
JOIN customers c ON o.customer_id = c.id
WHERE c.region = 'North'AND o.order_date > '2023-01-01';

在优化的写法中,首先通过JOIN条件连接orderscustomers表,然后通过最能缩小结果集的条件c.region = 'North'进行过滤,最后才是其他条件。

2. 用EXISTS替代IN、用NOT EXISTS替代NOT IN

原则:在处理子查询时,使用EXISTS通常比IN更高效,特别是在子查询返回大量数据时。

解释EXISTS会在找到第一条匹配记录后立即返回结果,而IN则需要构建整个结果集再进行匹配。在大数据量情况下,EXISTS的性能优势更加明显。

示例

-- 使用IN的写法
SELECT * 
FROM orders 
WHERE customer_id IN (SELECT id FROM customers WHERE region = 'North');-- 使用EXISTS的写法
SELECT * 
FROM orders o
WHERE EXISTS (SELECT 1 FROM customers c WHERE c.id = o.customer_id AND c.region = 'North');

在这个例子中,使用EXISTS避免了构建包含所有customer_id的中间结果集,从而提高了查询效率。

3. 避免在索引列上使用计算

原则:在索引列上进行计算会导致索引失效,从而引发全表扫描。

解释:索引是预先计算并存储的,如果在索引列上进行计算(如加减乘除、函数等),数据库将无法直接使用索引,而是需要对每一行数据进行计算后再比较,这会导致性能大幅下降。

示例

-- 不优化的写法
SELECT * 
FROM orders 
WHERE YEAR(order_date) = 2023;-- 优化的写法
SELECT * 
FROM orders 
WHERE order_date BETWEEN '2023-01-01' AND '2023-12-31';

在优化的写法中,通过直接使用日期范围查询,避免了在order_date列上进行YEAR函数计算,从而能够利用索引提高查询效率。

4. 避免在索引列上使用IS NULL和IS NOT NULL

原则:在索引列上使用IS NULLIS NOT NULL会导致索引失效,应尽量避免。

解释:大多数数据库对NULL值的索引处理不够高效,使用IS NULLIS NOT NULL查询时,可能会导致全表扫描,从而影响性能。

示例

-- 不优化的写法
SELECT * 
FROM customers 
WHERE email IS NULL;-- 优化的写法(假设email字段允许空字符串代替NULL)
SELECT * 
FROM customers 
WHERE email = '';

在实际业务中,可以通过设置默认值(如空字符串)来代替NULL,从而避免在索引列上使用IS NULL查询。

5. 建立索引

原则:应尽量避免全表扫描,首先考虑在whereorder by涉及的列上建立索引。

解释:索引可以显著提高查询速度,特别是在处理大量数据时。通过在where条件和order by排序涉及的列上建立索引,可以大大减少数据扫描的行数,从而提高查询效率。

示例

-- 假设没有索引
SELECT * 
FROM orders 
WHERE customer_id = 123 
ORDER BY order_date;-- 建立索引
CREATE INDEX idx_orders_customer_id ON orders(customer_id);
CREATE INDEX idx_orders_order_date ON orders(order_date);-- 使用索引后的查询
SELECT * 
FROM orders 
WHERE customer_id = 123 
ORDER BY order_date;

在建立索引后,查询性能会显著提升,因为数据库可以直接通过索引定位到符合条件的数据行,而无需进行全表扫描。

6. 避免在where子句中对字段进行null值判断

原则:尽量避免在where子句中对字段进行null值判断,否则将导致索引失效。

解释:与在索引列上使用IS NULL类似,直接在where子句中对字段进行null值判断也会导致索引失效,从而引发全表扫描。

示例

-- 不优化的写法
SELECT * 
FROM employees 
WHERE manager_id IS NULL;-- 优化的写法(通过业务逻辑避免NULL值)
SELECT * 
FROM employees 
WHERE manager_id = 0; -- 假设0表示没有经理

在实际业务设计中,可以通过特殊值(如0或-1)来代替NULL,从而避免在where子句中进行null值判断。

7. 避免在where子句中对字段进行表达式操作

原则:避免在where子句中对字段进行表达式操作,这将导致索引失效。

解释:在索引列上进行表达式操作(如加减乘除、字符串操作等)会导致索引失效,因为数据库需要对每一行数据进行计算后才能进行比较。

示例

-- 不优化的写法
SELECT * 
FROM products 
WHERE price * 1.1 > 100;-- 优化的写法
SELECT * 
FROM products 
WHERE price > 100 / 1.1;

在优化的写法中,通过将表达式移到比较值的右侧,避免了在price列上进行计算,从而能够利用索引提高查询效率。

综合实践

结合以上优化方法,我们可以对一个复杂的查询进行综合优化。假设我们有以下两个表:orders(订单表)和customers(客户表),我们需要查询2023年北区客户的所有订单,并按照订单日期排序。

未优化的查询

SELECT o.* 
FROM orders o
WHERE o.customer_id IN (SELECT c.id FROM customers c WHERE c.region = 'North')AND YEAR(o.order_date) = 2023
ORDER BY o.order_date;

优化后的查询

-- 首先建立索引
CREATE INDEX idx_customers_region ON customers(region);
CREATE INDEX idx_orders_customer_id ON orders(customer_id);
CREATE INDEX idx_orders_order_date ON orders(order_date);-- 优化后的查询
SELECT o.* 
FROM orders o
JOIN customers c ON o.customer_id = c.id
WHERE c.region = 'North'AND o.order_date BETWEEN '2023-01-01' AND '2023-12-31'
ORDER BY o.order_date;

在优化后的查询中,我们做了以下改进:

  1. 通过JOIN代替子查询,提高了连接效率。
  2. YEAR(o.order_date) = 2023替换为日期范围查询,避免了在索引列上进行计算。
  3. customers表的region列、orders表的customer_id列和order_date列上建立了索引,提高了查询速度。

通过这些优化措施,我们可以显著提升查询性能,特别是在处理大量数据时。SQL语句优化是一个持续的过程,需要根据具体的业务场景和数据特点进行不断调整和优化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/471830.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用 Python 从零开始创建神经网络(三):添加层级(Adding Layers)

添加层级(Adding Layers) 引言1. Training Data2. Dense Layer Class 引言 我们构建的神经网络变得越来越受人尊敬,但目前我们只有一层。当神经网络具有两层或更多隐藏层时,它们变成了“深度”网络。目前我们只有一层&#xff0c…

MFC工控项目实例三十实现一个简单的流程

启动按钮夹紧 密闭,时间0到平衡 进气,时间1到进气关,时间2到平衡关 检测,时间3到平衡 排气,时间4到夹紧开、密闭开、排气关。 相关代码 void CSEAL_PRESSUREDlg::OnTimer_2(UINT nIDEvent_2) {// if (nIDEvent_21 &am…

Java I/O(输入/输出)——针对实习面试

目录 Java I/O(输入/输出)什么是Java I/O流?字节流和字符流有什么区别?什么是缓冲流?为什么要使用缓冲流?Java I/O中的设计模式有哪些?什么是BIO?什么是NIO?什么是AIO&am…

Exploring Defeasible Reasoning in Large Language Models: A Chain-of-Thought A

文章目录 题目摘要简介准备工作数据集生成方法实验结论 题目 探索大型语言模型中的可废止推理:思路链 论文地址:http://collegepublications.co.uk/downloads/LNGAI00004.pdf#page136 摘要 许多大型语言模型 (LLM) 经过大量高质量数据语料库的训练&…

数据结构--数组

一.线性和非线性 线性:除首尾外只有一个唯一的前驱和后继。eg:数组,链表等。 非线性:不是线性的就是非线性。 二.数组是什么? 数组是一个固定长度的存储相同数据类型的数据结构,数组中的元素被存储在一…

MySQL技巧之跨服务器数据查询:基础篇-更新语句如何写

MySQL技巧之跨服务器数据查询:基础篇-更新语句如何写 上一篇已经描述:借用微软的SQL Server ODBC 即可实现MySQL跨服务器间的数据查询。 而且还介绍了如何获得一个在MS SQL Server 可以连接指定实例的MySQL数据库的连接名: MY_ODBC_MYSQL 以及用同样的…

Unity教程(十八)战斗系统 攻击逻辑

Unity开发2D类银河恶魔城游戏学习笔记 Unity教程(零)Unity和VS的使用相关内容 Unity教程(一)开始学习状态机 Unity教程(二)角色移动的实现 Unity教程(三)角色跳跃的实现 Unity教程&…

前端学习八股资料CSS(二)

更多详情:爱米的前端小笔记,更多前端内容,等你来看!这些都是利用下班时间整理的,整理不易,大家多多👍💛➕🤔哦!你们的支持才是我不断更新的动力!找…

云计算研究实训室建设方案

一、引言 随着云计算技术的迅速发展和广泛应用,职业院校面临着培养云计算领域专业人才的迫切需求。本方案旨在构建一个先进的云计算研究实训室,为学生提供一个集理论学习、实践操作、技术研发与创新于一体的综合性学习平台,以促进云计算技术…

通过Python 调整Excel行高、列宽

在Excel中,默认的行高和列宽可能不足以完全显示某些单元格中的内容,特别是当内容较长时。通过调整行高和列宽,可以确保所有数据都能完整显示,避免内容被截断。合理的行高和列宽可以使表格看起来更加整洁和专业,尤其是在…

【代码审计】常见漏洞专项审计-业务逻辑漏洞审计

❤️博客主页: iknow181 🔥系列专栏: 网络安全、 Python、JavaSE、JavaWeb、CCNP 🎉欢迎大家点赞👍收藏⭐评论✍ 0x01 漏洞介绍 1、 原理 业务逻辑漏洞是一类特殊的安全漏洞,业务逻辑漏洞属于设计漏洞而非实…

Wordpress常用配置,包括看板娘跨域等

一个Wordpress的博客已经搭建完成了,那么为了让它看起来更有人间烟火气一点,有一些常用的初始配置,这里整理一下。 修改页脚 页脚这里默认会显示Powered by Wordpress,还有一个原因是这里要加上备案信息。在主题里找到页脚&…

数据库范式、MySQL 架构、算法与树的深入解析

一、数据库范式 在数据库设计中,范式是一系列规则,用于确保数据的组织和存储具有良好的结构、完整性以及最小化的数据冗余。如果不遵循范式设计,数据可能会以平铺式罗列,仅使用冒号、分号等简单分隔。这种方式存在诸多弊端&#…

Taro React-Native IOS 打包发布

http网络请求不到 配置 fix react-native facebook::flipper::SocketCertificateProvider‘ (aka ‘int‘) is not a function or func_rn运行debug提示flipper-CSDN博客 Xcode 15(iOS17)编译适配报错_no template named function in namespace std-CS…

基于yolov8、yolov5的车型检测识别系统(含UI界面、训练好的模型、Python代码、数据集)

摘要:车型识别在交通管理、智能监控和车辆管理中起着至关重要的作用,不仅能帮助相关部门快速识别车辆类型,还为自动化交通监控提供了可靠的数据支撑。本文介绍了一款基于YOLOv8、YOLOv5等深度学习框架的车型识别模型,该模型使用了…

从python源码到可自动更新软件

相关阅读 标题链接如何打包python程序为exebczl【auto-py-to-exe 可视化打包python到exe】51CTO ZATA 1. python源码 打包时需要特别注意的源码编写规范 除了基本的 Python 编码规范之外,在准备程序进行打包时,还需要特别注意以下几点: 1.1 依赖管理 确保 requirements.t…

javaWeb小白项目--学生宿舍管理系统

目录 一、检查并关闭占用端口的进程 二、修改 Tomcat 的端口配置 三、重新启动 Tomcat 一、javaw.exe的作用 二、结束javaw.exe任务的影响 三、如何判断是否可以结束 结尾: 这个错误提示表明在本地启动 Tomcat v9.0 服务器时遇到了问题,原因是所需…

k8s笔记——核心概念

什么是K8s Kubernetes 也称为 K8s,是用于自动部署、扩缩和管理容器化应用程序的开源系统。 Kubernetes 最初是由 Google 工程师作为 Borg 项目开发和设计的,后于 2015 年捐赠给 云原生计算基金会(CNCF)。 什么是 Kubernetes 集群…

SkyWalking-安装

SkyWalking-简单介绍 是一个开源的分布式追踪系统,用于检测、诊断和优化分布式系统的功能。 支持 ElasticSearch、H2、MySQL、PostgreSql 等数据库 基于 ElasticSearch 的情况 ElasticSearch(ES) 安装 1、下载并解压 https://www.elastic…

怎么样绑定域名到AWS(亚马逊云)服务器

1,拿着你买的域名去亚马逊申请一个证书。申请证书分两种,一种是去亚马逊后台填域名手动申请 ,另一种是通过API来申请,类似如下代码: 2、证验证书。有两种方式:一种是通过邮件,另一种去到域名提供…