Mysql--基础篇--多表查询(JOIN,笛卡尔积)

在MySQL中,多表查询(也称为联表查询或JOIN操作)是数据库操作中非常常见的需求。通过多表查询,你可以从多个表中获取相关数据,并根据一定的条件将它们组合在一起。MySQL支持多种类型的JOIN操作,每种JOIN都有不同的用途和行为。

1、JOIN的基本概念

JOIN是一种用于从多个表中检索数据的操作。它允许你根据某些条件将两个或多个表中的行组合在一起。JOIN操作的核心思想是基于表之间的关联字段(通常是外键)来匹配行,并返回符合条件的结果集。

(1)、关联字段

  • 主键(Primary Key):唯一标识表中每一行的字段。
  • 外键(Foreign Key):一个表中的字段,引用另一个表的主键。外键用于建立表与表之间的关系。

(2)、JOIN类型

MySQL支持以下几种主要的JOIN类型:

  • 内连接(INNER JOIN):只返回两个表中满足连接条件的行。
  • 左连接(LEFT JOIN):返回左表中的所有行,即使右表中没有匹配的行,结果集中右表的列将填充为NULL。
  • 右连接(RIGHT JOIN):返回右表中的所有行,即使左表中没有匹配的行,结果集中左表的列将填充为NULL。
  • 全外连接(FULL OUTER JOIN):返回两个表中的所有行,无论是否满足连接条件。MySQL 不直接支持FULL OUTER JOIN,但可以通过UNION实现类似的效果。
  • 交叉连接(CROSS JOIN):返回两个表的笛卡尔积,即每个表中的每一行都与另一个表中的每一行组合。

2、JOIN的语法

(1)、内连接(INNER JOIN)

内连接是最常用的JOIN类型,它只返回两个表中满足连接条件的行。

示例:
假设我们有两个表employees和departments,其中employees表包含员工信息,departments表包含部门信息。employees表中的department_id字段是外键,引用了departments表的id字段。
sql:

-- 查询所有有部门的员工及其所属部门名称
SELECT employees.name, departments.name AS department_name
FROM employees
INNER JOIN departments ON employees.department_id = departments.id;

结果:
只返回那些有对应部门的员工信息。如果某个员工没有分配到任何部门,则该员工不会出现在结果集中。

(2)、左连接(LEFT JOIN)

左连接返回左表中的所有行,即使右表中没有匹配的行。对于右表中没有匹配的行,结果集中右表的列将填充为NULL。

示例:
查询所有员工及其所属部门名称,即使某些员工没有分配到部门
sql:

SELECT employees.name, departments.name AS department_name
FROM employees
LEFT JOIN departments ON employees.department_id = departments.id;

结果:
返回所有员工的信息。对于没有分配到部门的员工,department_name列将显示为NULL。

(3)、右连接(RIGHT JOIN)

右连接返回右表中的所有行,即使左表中没有匹配的行。对于左表中没有匹配的行,结果集中左表的列将填充为NULL。

示例:
查询所有部门及其员工,即使某些部门没有员工
sql:

SELECT employees.name, departments.name AS department_name
FROM employees
RIGHT JOIN departments ON employees.department_id = departments.id;

结果:
返回所有部门的信息。对于没有员工的部门,employees.name 列将显示为 NULL。

(4)、全外连接(FULL OUTER JOIN)

全外连接返回两个表中的所有行,无论是否满足连接条件。MySQL不直接支持FULL OUTER JOIN,但可以通过 UNION 实现类似的效果。

示例:
查询所有员工及其所属部门,以及所有部门及其员工
sql:

SELECT employees.name, departments.name AS department_name
FROM employees
LEFT JOIN departments ON employees.department_id = departments.id
UNION
SELECT employees.name, departments.name AS department_name
FROM employees
RIGHT JOIN departments ON employees.department_id = departments.id;

结果:
返回所有员工和部门的信息。对于没有分配到部门的员工,department_name列将显示为NULL;对于没有员工的部门,employees.name列将显示为NULL。

(5)、交叉连接(CROSS JOIN)

交叉连接返回两个表的笛卡尔积,即每个表中的每一行都与另一个表中的每一行组合。

示例:
查询所有员工与所有部门的组合
sql:

SELECT employees.name, departments.name AS department_name
FROM employees
CROSS JOIN departments;

结果:
返回每个员工与每个部门的组合,结果集的行数等于employees表的行数乘以 departments表的行数。
在这里插入图片描述

3、多表查询的高级用法

(1)、多表JOIN

你可以在一个查询中连接多个表。只需在FROM子句中依次添加多个JOIN语句即可。

示例:
假设我们有三个表:employees(员工表)、departments(部门表)和salaries(工资表)。我们希望查询每个员工的姓名、所属部门名称以及他们的工资。
sql:

SELECT employees.name, departments.name AS department_name, salaries.salary
FROM employees
INNER JOIN departments ON employees.department_id = departments.id
INNER JOIN salaries ON employees.id = salaries.employee_id;

结果:
返回每个员工的姓名、所属部门名称以及他们的工资。

(2)、自连接(Self Join)

自连接是指一个表与自身进行连接。这通常用于处理具有层次结构的数据,例如员工的上下级关系。

示例:
假设employees表中有一个manager_id字段,表示每个员工的上级领导。我们希望查询每个员工及其上级领导的姓名。
sql:

SELECT e1.name AS employee_name, e2.name AS manager_name
FROM employees e1
LEFT JOIN employees e2 ON e1.manager_id = e2.id;

结果:
返回每个员工及其上级领导的姓名。对于没有上级领导的员工,manager_name列将显示为NULL。

(3)、子查询(Subquery)

子查询是指在一个查询中嵌套另一个查询。子查询可以用于过滤、聚合等操作。

示例:
假设我们想查询工资高于平均工资的员工。
sql:

SELECT employees.name, salaries.salary
FROM employees
INNER JOIN salaries ON employees.id = salaries.employee_id
WHERE salaries.salary > (SELECT AVG(salary) FROM salaries);

结果:
返回工资高于平均工资的员工及其工资。

4、JOIN的性能优化

多表查询可能会对性能产生影响,尤其是在处理大量数据时。为了提高多表查询的性能,可以采取以下几种优化措施:

(1)、索引优化

  • 确保连接字段上有索引:在JOIN操作中,连接条件中的字段(如外键)应该有索引。索引可以显著提高查询的执行速度。

  • 覆盖索引:如果查询中涉及的列都在索引中,MySQL可以直接从索引中获取数据,而不需要访问实际的表数据。这种情况下,查询性能会大幅提升。

(2)、避免不必要的列

  • 只选择需要的列:在SELECT语句中,尽量只选择你需要的列,而不是使用 SELECT *。这样可以减少I/O操作,提升查询性能。

(3)、使用适当的JOIN类型

  • 选择合适的JOIN类型:根据业务需求选择合适的JOIN类型。例如,如果你只需要查询满足条件的行,使用INNER JOIN;如果你需要保留所有行,使用LEFT JOIN或RIGHT JOIN。

(4)、分页查询

  • 使用分页查询:如果你只需要查询部分数据,可以使用LIMIT和OFFSET进行分页查询,避免一次性加载大量数据。

示例:

SELECT employees.name, departments.name AS department_name
FROM employees
INNER JOIN departments ON employees.department_id = departments.id
LIMIT 10 OFFSET 0;

结果:
返回前 10 条记录。

(5)、EXPLAIN分析查询计划

  • 使用EXPLAIN分析查询计划:通过EXPLAIN关键字,可以查看MySQL如何执行查询,帮助你发现潜在的性能问题。EXPLAIN会显示查询的执行计划,包括使用的索引、扫描的行数等信息。

示例:

EXPLAIN SELECT employees.name, departments.name AS department_name
FROM employees
INNER JOIN departments ON employees.department_id = departments.id;

结果:
返回查询的执行计划,帮助你分析查询的性能瓶颈。

5、常见问题及解决方案

(1)、笛卡尔积问题

  • 问题描述:如果不指定连接条件,JOIN操作可能会导致笛卡尔积,即每个表中的每一行都与另一个表中的每一行组合,结果集的行数可能非常大。

  • 解决方案:始终确保在JOIN操作中指定明确的连接条件,避免笛卡尔积的发生。

(2)、N+1查询问题

  • 问题描述:是指在执行一次查询后,又触发了多个额外的查询,导致查询次数大幅增加,影响数据库性能。这种情况通常发生在ORM(对象关系映射)框架中。如获取所有人员所在部门信息,N+1问题就是:先查询主表中所有的人员,在遍历所有人员去查询部门表。

  • 解决方案:使用JOIN进行批量查询:将主表和子表的数据一次性查询出来,避免N+1造成多次查询问题。

(3)、重复数据问题

  • 问题描述:在某些复杂的JOIN操作中,可能会出现重复数据。例如,当一个表中有多个匹配的行时,结果集中可能会出现重复的记录。

  • 解决方案:使用DISTINCT关键字去除重复数据,或者调整JOIN条件,确保结果集中没有重复的行。

示例:

SELECT DISTINCT employees.name, departments.name AS department_name
FROM employees
INNER JOIN departments ON employees.department_id = departments.id;

结果:
返回不重复的员工及其所属部门名称。

6、总结

  • JOIN是MySQL中用于从多个表中检索数据的强大工具。通过不同的JOIN类型(如INNER JOIN、LEFT JOIN、RIGHT JOIN等),你可以根据业务需求灵活地组合多个表的数据。
  • 性能优化是多表查询中不可忽视的一部分。通过合理的索引设计、选择合适的JOIN类型、避免不必要的列以及使用EXPLAIN分析查询计划,可以显著提升查询的性能。
  • 常见问题(如笛卡尔积、N+1查询、重复数据等)需要特别注意,并采取相应的解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/675.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构】第1天之Java中的数据结构

前言 众所周知,程序数据结构算法,可见数据结构的重要性。 在Java中,数据结构通常指的是Java集合框架中的类和接口。 Java集合框架提供了一套标准的数据结构,例如列表、集合、映射表等,以及相应的实现类。 今天要分享的…

js代理模式

允许在不改变原始对象的情况下,通过代理对象来访问原始对象。代理对象可以在访问原始对象之前或之后,添加一些额外的逻辑或功能。 科学上网过程 一般情况下,在访问国外的网站,会显示无法访问 因为在dns解析过程,这些ip被禁止解析,所以显示无法访问 引…

docker-compose方式部署单机版RocketMQ

1、准备工作目录和配置文件 rocketmq\_ conf/broker.conf\_ docker-compose.yml在 rocketmq/conf/ 目录下面,创建broker.conf文件: # Broker所属的集群名称,默认是DefaultCluster brokerClusterNameDefaultCluster# Broker的名称 brokerNam…

有收到腾讯委托律师事务所向AppStore投诉带有【水印相机】主标题名称App的开发者吗

近期,有多名开发者反馈,收到来自腾讯科技 (深圳) 有限公司委托北京的一家**诚律师事务所卞,写给AppStore的投诉邮件。 邮件内容主要说的是,腾讯注册了【水印相机】这四个字的商标,所以你们这些在AppStore上的app&…

爬虫基础之爬取歌曲宝歌曲批量下载

声明:本案列仅供学习交流使用 任何用于非法用途均与本作者无关 需求分析: 网站:邓紫棋-mp3在线免费下载-歌曲宝-找歌就用歌曲宝-MP3音乐高品质在线免费下载 (gequbao.com) 爬取 歌曲名 歌曲 实现歌手名称下载所有歌曲 本案列所使用的模块 requests (发送…

Java 如何传参xml调用接口获取数据

传参和返参的效果图如下: 传参: 返参: 代码实现: 1、最外层类 /*** 外层DATA类*/ XmlRootElement(name "DATA") public class PointsXmlData {private int rltFlag;private int failType;private String failMemo;p…

java项目之在线文档管理系统源码(springboot+mysql+vue+文档)

大家好我是风歌,曾担任某大厂java架构师,如今专注java毕设领域。今天要和大家聊的是一款基于springboot的在线文档管理系统。项目源码以及部署相关请联系风歌,文末附上联系信息 。 项目简介: 在线文档管理系统的主要使用者分为管…

学技术步骤,(tomcat举例)jar包api手写tomcat静态资源基础服务器

1.看有哪些包,能用本地离线的包就使用离线包 2.尽量不要使用配置文件(先不用),能用api就用api, 因为配置文件只是文本,其实要的只是配置文件里的参数, 这些参数最后肯定还是要给到这些api去处…

React中createRoot函数原理解读——Element对象与Fiber对象、FiberRootNode与HostRootNode

【2024最新版】React18 核心源码分析教程(全61集) Element对象与Fiber对象 在 React 中,Element 对象 和 Fiber 对象 是核心概念,用于实现 React 的高效渲染和更新机制。以下是它们的详细解读: 1. Element 对象 定…

如何用SQL语句来查询表或索引的行存/列存存储方式|OceanBase 用户问题集锦

一、问题背景 自OceanBase 4.3.0版本起,支持了列存引擎,允许表和索引以行存、纯列存或行列冗余的形式创建,且这些存储方式可以自由组合。除了使用 show create table命令来查看表和索引的存储类型外,也有用户询问如何通过SQL语句…

超完整Docker学习记录,Docker常用命令详解

前言 关于国内拉取不到docker镜像的问题,可以利用Github Action将需要的镜像转存到阿里云私有仓库,然后再通过阿里云私有仓库去拉取就可以了。 参考项目地址:使用Github Action将国外的Docker镜像转存到阿里云私有仓库 一、Docker简介 Do…

数据结构-排序课后题

今天我们来简单的说说关于排序的一些课后练习题. 对应的知识点博客: LINK. 目录 1. 每一单趟都能确定一个数字的最终位置的排序2. 根据序列变化确定排序方式3. 排序顺序对哪些排序效率影响不大?4. 对有序序列排序最费力的排序方式是什么?5. 对接近有序序列排序最快的排序方式…

MySQL 架构

MySQL架构 MySQL8.0服务器是由连接池、服务管理⼯具和公共组件、NoSQL接⼝、SQL接⼝、解析器、优化 器、缓存、存储引擎、⽂件系统组成。MySQL还为各种编程语⾔提供了⼀套⽤于外部程序访问服务器的连接器。整体架构图如下所⽰: MySQL Connectors:为使⽤…

【数据结构】二叉搜索树

目录 1. 二叉搜索树的概念 2. 二叉搜索树的性能分析 3.二叉搜索树的实现 3. 1.二叉搜索树的插入 3.2. 二叉搜索树的查找 3.3. 二叉搜索树的删除 3.4. 二叉搜索树的实现代码 4. 二叉搜索树key和key/value两种使用场景 4.1 key搜索场景: 4.2 key/value搜索场…

【C++】string的关系运算与比较分析

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C 文章目录 💯前言💯基础知识:C 中的 string 关系运算器1. 关系运算器概述2. 字符串比较的本质 💯代码解析与扩展代码例一:相等比较代码解析输出 代码例二&a…

高性能网络模式:Reactor 和 Proactor

Reactor Reactor 采用I/O多路复用监听事件,收到事件后,根据事件类型分配给某个进程/线程。 实际应用中用到的模型: 单 Reactor 单进程 单 Reactor 多线程 优点:能充分利用多核CPU性能。 缺点:存在多线程竞争共享资源…

有限元分析学习——Anasys Workbanch第一阶段笔记(10)桌子载荷案例分析_实际载荷与均布载荷的对比

目录 0 序言 1 桌子案例 2 模型简化 3 方案A 前处理 1)分析类型选择 2)材料加载 3)约束、载荷及接触 4)控制网格(网格大小需要根据结果不断调整) 初始计算结果 加密后计算结果 4 方案B、C 前处理 1)分析…

用HTML + CSS实现太极图

目录 一、效果图 二、实现思路 三、完整代码 四、总结 一、效果图 如图所示,太极图一半为黑色(代表阴),另一半为白色(代表阳)。这两部分相互环绕,形成一种流动的、旋转的感觉。 二、实现思…

【Rust自学】11.7. 按测试的名称运行测试

喜欢的话别忘了点赞、收藏加关注哦,对接下来的教程有兴趣的可以关注专栏。谢谢喵!(・ω・) 11.7.1. 按名称运行测试的子集 如果想要选择运行的测试,就将测试的名称(一个或多个)作为cargo test的…

标准应用 | 2025年网络安全服务成本度量实施参考

01 网络安全服务成本度量依据相关新变化 为了解决我国网络安全服务产业发展中面临的服务供需两方对于服务成本组成认知偏差较大、网络安全服务成本度量缺乏依据的问题,中国网络安全产业联盟(CCIA)组织北京赛西科技发展有限责任公司、北京安…