MySQL —— 聚合查询，分组查询与联合查询

聚合函数

常见的统计总数、计算平局值等操作，可以使用聚合函数来实现，常见的聚合函数有：

函数	说明
count()	统计数据总数
sum()	求和
avg()	求平均值
max()	求最大值
min()	求最小值

注意凡是涉及运算的，数据库会自动掉 NULL 值
注意NULL 是不参与比较 max 与 min 的

解析：

以此表为例
在这里插入图片描述

count()

count()，会统计数据总数

使用 count(*) 会查询一共有多少条数据行
在这里插入图片描述

使用 count(列名)，会统计该列有多少行数据
在这里插入图片描述

如果列中有NULL 值，则不会被统计在内

建议使用 count(*) 来统计数据行，这是SQL 标准提出的。

sum()

如果运算中有NULL 值会自动过滤NULL，因为NULL 经过运算后为 NULL这个数据是没有意义的，所以数据库的开发者们进行了这样的运算设计。

如果运算遇到非数字型数据，则无法进行运算，会报警告：

注意可以使用表达式，但是如果想分别求每一列的总分还是要分开写的。

avg()

在这里插入图片描述

max() 与 min()

在这里插入图片描述

注意NULL 是不参与比较的

实践

1.统计班级共有多少同学

select count(name) from exam;

2.统计班级收集的 math 数学成绩数据有多少个

select count(math) from exam;

3.统计数学成绩总分

select sum(math) from exam;

4.统计所有数学成绩不及格（< 60）的同学的数学总分

select sum(math) from exam where math < 60;

5.统计三科的平均总分

select avg(chinese + math + english) 三科平均分 from exam;

6.返回英语最高分

select max(english) from exam;

7.返回 > 70 分以上的数学最低分

select min(math) from exam where math > 70;

分组查询

group by

SELECT 中使用 GROUP BY 子句可以对指定列进行分组查询。需要满足：使用 GROUP BY 进行分组查询时，SELECT 指定的字段必须是“分组依据字段”，其他字段若想出现在SELECT 中则必须包含在聚合函数中。

select column1, sum(column2), .. from table group by column1,column3;

演示表：
在这里插入图片描述

计算每种职位的平均工资：
在这里插入图片描述

这里的执行顺序是先分组再计算。

拓展 round

可以使用 round(数值,小数点后的位数) 来指定数值的形式：
group by 后面可以跟 order by 子句

在这里插入图片描述
练习：
查询每个角色的最高工资、最低工资和平均工资

select role 职位, max(salary) 最高工资, min(salary) 最低工资 from emp group by 职位;

在这里插入图片描述

having

GROUP BY 子句进行分组以后，需要对分组结果再进行条件过滤时，不能使用 WHERE 语句，而需要用
HAVING

where 是对表中每一行的真实数据进行过滤的
having 是在 group by 之后，对计算结果进行过滤的。
所以两个执行顺序是不一样的，having 可以使用别名来过滤

演示：
显示平均工资低于1500的角色和它的平均工资

select role 职位, avg(salary) 平均工资 from emp group by 职位 having 平均工资 < 1500;

在这里插入图片描述

联合查询

实际开发中往往数据来自不同的表，所以需要多表联合查询。多表查询是对多张表的数据取笛卡尔积：
在这里插入图片描述

笛卡尔积实际上就是对数据进行全排列，举个例子，有两张表，其中一张表的一条数据要和另一张表的所有的数据进行组合：
在这里插入图片描述

我们也可以通过 SQL 代码来查看笛卡尔积：select * from table_name1, table_name2;
![在这在这里插入图片描述

通过观察我们得知上面全排列的数据不全是正确的，那我们如果过滤掉这些无效的数据，从而获取正确的数据？
请看下面揭晓

内连接

语法格式：select 字段 from 表1 别名1, 表2 别名2 where 条件; 或者 select 字段 from 表1 别名1 [inner] join 表2 别名2 on 条件;

两个表之间存在主外键关系的话，只需要判断这两个表中主外键字段是否相同即可。

查询列表的字段可以使用 表名.列名

我们可以通过给表名取字段的方式来减少我们的书写量。

演示：

select s.student_id, s.sn, s.name, s.mail, c.name from student s, class c where s.class_id = c.class_id;

在这里插入图片描述

select s.student_id, s.sn, s.name, s.mail, c.name from student s inner join class c on s.class_id = c.class_id;

在这里插入图片描述

当你给表取了别名之后，那就将表名的地方全部替换成别名，否则 where 子句会识别不出。

联合查询的步骤：
首先确定查询中涉及哪些表，然后对这些表取笛卡尔积，再确定连接条件与过滤条件，最后简化语句（使用别名）

实践:

查询白素贞的成绩：

首先确定需要哪些表：学生表和成绩表，取笛卡尔积：
在这里插入图片描述
然后确定连接条件：student_id 是相同的

确定过滤条件：姓名是白素贞

简化 sql 语句，将student 取 stu , score 取 sco

select stu.name, sco.score from student stu, score sco where name = '白素贞' and stu.student_id = sco.student_id;

select stu.name, sco.score from student stu join score sco on name = '白素贞' and stu.student_id = sco.student_id;

在这里插入图片描述

查询所有同学的总成绩，及同学的个人信息：

首先确定需要什么表：学生表，成绩表；然后取笛卡尔积：
在这里插入图片描述

然后确定连接条件与过滤条件：首先是由于需要的是总成绩，所以要使用聚合函数 sum()，那么就要使用到分组查询 group by 子句，接着成绩表和学生表的连接是 student_id 要相同

这里要注意分组的依据，我们是对成绩表进行分组的，成绩表有学生的 id 和成绩，那就应该是要按学生的 id 作为分组的依据。

最后简化 sql 语句将student 取 stu , score 取 sco

select stu.name, stu.mail, sum(sco.score) from student stu, score sco where stu.student_id = sco.student_id group by sco.student_id;

在这里插入图片描述

查询所有同学的总成绩，及同学的个人信息以及学生所在的班级信息：

首先确定要几张表：学生表，班级表以及成绩表，然后取笛卡尔积：
在这里插入图片描述
然后确定连接条件与过滤条件：学生表和班级表的联系是 class_id 相同，学生表和成绩表的联系是 student_id 相同，总成绩就和上面的方式一样使用 sum() 通过 student_id 来进行分组。

然后简化 sql 语句：

select stu.sn 学号, stu.name 姓名, stu.mail 邮箱, sum(sco.score) 总成绩, c.name from student stu, score sco, class c where stu.student_id = sco.student_id and stu.class_id
= c.class_id group by sco.student_id;

在这里插入图片描述

外连接

外连接分为左外连接和右外连接。如果联合查询，左侧的表完全显示就是左外连接；右侧的表完全显示就是右外连接。

语法：左外连接： select 字段名 from 表名1 left join 表名2 on 连接条件; 与 右外连接： select 字段 from 表名1 right join 表名2 on 连接条件;

大家来看一下下面两张表，你会发现 3班是没有学生的。
在这里插入图片描述

现在我们基于上述的式子，演示左外连接：select * from class c left join student s on c.class_id = s.class_id;
在这里插入图片描述
即使 3 班是没有同学的，但是3班这个字段还是会显示出来，只是对应的学生列表为空。

现在我们插入一个没有班级的学生数据：
在这里插入图片描述

然后我们来演示右外连接：select * from class c right join student s on c.class_id = s.class_id; 这里会将 student 表全部显示，即使有学生没有班级这个数据。

在这里插入图片描述

进行外连接如果遇到没有数据的时候，数据库会使用 NULL 填充。

自连接

自连接是指在同一张表连接自身进行查询。

语法：select * from 表名1 别名1, 表名1 别名2;

注意一定要起别名，不然MySQL 无法识别：

一般自连接会用在自己要和自己比较的时候

演示:
查询哪些学生的 Java 成绩比计算机原理要低：可以先查出Java 和计算机原理的 course_id
select * from score s1, score s2 where s1.course_id = 1 and s2.course_id = 3 and s1.score < s2.score;

在这里插入图片描述