大数据:
2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试
文章目录
- 大数据:
- @[TOC](文章目录)
- c4.5决策树
- sql考题
- 30个经典sql题目
- 总结
文章目录
- 大数据:
- @[TOC](文章目录)
- c4.5决策树
- sql考题
- 30个经典sql题目
- 总结
c4.5决策树
sql考题
select sid, sum(amount) as sum from a group by sid order by sum(amount) desc limit 200
订单排名前十的,他的渠道
left join
select sid, channel, row_number() over(partition by sid order by amout desc)
on a.sid = b.sid
这样就且出来了
a表,仨列
登录信息,粉丝数量
求出今天比作天提升最多的30个人
比如多音,每天都涨粉,就看你提升多少,需要做差
select uid from a order by diff desc limit 30
去求diff很重要
select a.uid, a.fans-b.fans from
(select uid,logdate,fans from a where logdata=今天)
(select uid,logdate,fans from a where logdata=昨天) b on a.uid=b.uid
30个经典sql题目
学生
老师
课程
成绩
01笔02分数高的学生
数学和语文
按学号分组
然后单独看不同的课程
关联查询
inner join
先看01课程的数据
再看02课程的数据
然后就比01分数大的,学生的sid
然后把student的名字搞出来
方式2
case where,转化行列
按学生分组,本来就是应该看学生分组
avg
这好说
可以这么做
having是计算之后的
总成绩,多表关联查询
cid就是选课数量
根据id分组,就能统计
然后总成绩就是后面的成绩求和
老师表中查
姓名以李开头,需要like来做匹配
首字母是李,后续%随意
学过的学生,,不是这些学生就是没学过
not in
and
where 同时学
俩合并
关联
全小于60
通过学生分组
获取分数最大小于60的话,拿该学生gg
老牛逼
全部都得学
按照课程分组
如果学生数量不足3则gg
先看 01学生学了哪些课
有一个学生名字就行
要一模一样
同时匹配多门课
张三教啥课
然后找学生,看他们的平均成绩
看看学过的学生,然后not in
这些学生中
先看哪些不及格
然后统计学生数量有2个以上的
课程为主键
及格的人数站总人数的人
根据课程分组
看老师,然后看课程,找平均,desc排序
要根据课程分组
名字和性别看成同一个字段,做分组,这样就出来了
俩都行的
全部课程都选了
课程都有哪些
学生分组,他的课程数量是等于所有可成总数的时候就OK了
日期减法操作
当前日期减去出生日期
这离谱了
如果下周,就把本周+1就是加一周
data_add就是加日期,看你加天,周,还是月啥的
下个月类似
总结
提示:重要经验:
1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。