目录
相关表数据:
题目及思路解析:
汇总分析
1、查询编号为“02”的课程的总成绩
2、查询参加考试的学生个数
分组
1、查询各科成绩最高和最低的分,以如下的形式显示:课程号,最高分,最低分
2、查询每门课程有多少学生参加了考试(有考试成绩)
3、查询男生、女生人数
总结归纳:
知识补充:
相关表数据:
1、Score_info
2、Student_info
题目及思路解析:
汇总分析
1、查询编号为“02”的课程的总成绩
selectsum(score) score_sumfrom score_infowhere course_id='02'group by course_id;
或
select‘02’ course_id, -->即直接用id常数值sum(score) score_sum
from score_info
where course_id='02'
注意:这里如果没分组,那么会报一个语法错误,因为语法检查在编译阶段,所以,它并不知道你只有一个course_id,没法通过编译
selectcourse_id,sum(score) score_sum
from score_info
where course_id='02'
结果:
主要考察聚合函数与分组聚合使用
2、查询参加考试的学生个数
补充说明:在score_info表中score 无null数据,即只统计了有分数的学生成绩
selectcount(distinct stu_id) stu_num
from score_info;
结果:
这里注意去重,因为一个学生可能参加多门课程考试
分组
1、查询各科成绩最高和最低的分,以如下的形式显示:课程号,最高分,最低分
selectcourse_id,max(score) max_score,min(score) min_score
from score_info
group by course_id;
结果:
主要考察分组聚合的使用,以course_id进行分组,再利用聚合函数获取最大值与最小值
2、查询每门课程有多少学生参加了考试(有考试成绩)
selectcourse_id,count(distinct stu_id) stu_num
from score_info
group by course_id;
结果:
这题与上面第2题差不多,主要需要对每门课程进行分组
3、查询男生、女生人数
selectgender,count(distinct stu_id) count
from student_info
group by gender;
结果:
简单的分组聚合操作
总结归纳:
这几道题主要简单考察聚合函数的使用(count,max,min)与分组聚合的使用(group by)
知识补充:
·聚合函数,即将数据聚合在一起进行计算的函数,既然是函数自然有输入与输出
一般输入数据有多行,输出是经计算汇总的一个结果
1、count与sum联系区别
count(*),表示统计所有行数,包含null值;*相当于传入表中全部列
count(某列),表示该列一共有多少行,不包含null值;
sum(),求和,不包含null
二者可理解为,count求行数,sum求行的值
另外:
在hive 中count(*)与count(1(2,3等))结果都一样,底层执行也一样
2、min&max
max(),求最大值,不包含null,除非所有值都是null;
min(),求最小值,不包含null,除非所有值都是null;