最近七天内连续三天活跃用户数

最近七天内连续三天活跃用户数

首先,感谢大华公司给的面试机会,非常感谢~!
进入正题,建表:

create table uv_detail_daycount(
mid int
)PARTITIONED BY(dt string);

通过load将hdfs文件加载到hive中。
数据文件名如下:
在这里插入图片描述
里面的数据只有用户mid。如下所示:
在这里插入图片描述

每个日期对应的用户mid,即为该天活跃。
在这里插入图片描述
通过上图可以发现,最近七天内连续三天活跃用户数应该是001和002号用户,最终2021-08-10这天的最近七天内连续三天活跃用户数为2.

实现

第一步,查询最近七天的数据,并按照日期从小到大进行排序。

select mid,dt,rank() over(partition by mid order by dt) mid_dt_rankfrom uv_detail_daycountwhere dt >=date_add('2021-08-10',-6) and dt<='2021-08-10'

在这里插入图片描述
第二步,求日期和排名的差值.

with t1 as (select mid,dt,rank() over(partition by mid order by dt) mid_dt_rankfrom uv_detail_daycountwhere dt >=date_add('2021-08-10',-6) and dt<='2021-08-10')select mid,date_sub(dt, mid_dt_rank) date_dif
fromt1;

在这里插入图片描述
第三步,对用户和差值进行分组,然后通过having选择差值相同个数大于等于3的数据取出。

with t1 as (select mid,dt,rank() over(partition by mid order by dt) mid_dt_rankfrom uv_detail_daycountwhere dt >=date_add('2021-08-10',-6) and dt<='2021-08-10'),t2 as (select mid,date_sub(dt, mid_dt_rank) date_difffrom t1)SELECT mid 
from t2group by mid, date_diffHAVING count(*) >= 3;

在这里插入图片描述
第四步,根据用户id去重(为什么会出现重复的mid?最近七天可能用户前3天用户连续登录满足所求指标的要求,后三天也是如此,所以会出现mid重复。这个mid可以理解为该用户满足指标的次数吧,但是指标求的是活跃用户数,所以要去重)

with t1 as (select mid,dt,rank() over(partition by mid order by dt) mid_dt_rankfrom uv_detail_daycountwhere dt >=date_add('2021-08-10',-6) and dt<='2021-08-10'),t2 as (select mid,date_sub(dt, mid_dt_rank) date_difffrom t1),t3 as (SELECT mid from t2group by mid, date_diffHAVING count(*) >= 3)select mid	
fromt3group by mid;

在这里插入图片描述
第五步,整理显示:

with t1 as (select mid,dt,rank() over(partition by mid order by dt) mid_dt_rankfrom uv_detail_daycountwhere dt >= date_add('2021-08-10',-6) and dt <= '2021-08-10'),t2 as (select mid,date_sub(dt, mid_dt_rank) date_difffrom t1),t3 as (SELECT mid from t2group by mid, date_diffHAVING count(*) >= 3),t4 as(select mid	
fromt3group by mid) select '2021-08-10',concat(date_add('2021-08-10',-6),'至','2021-08-10'),count(*)
from t4;

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/71215.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据统计之日活跃用户统计

日活跃用户统计 接口分析 请求方式&#xff1a;GET /meiduo_admin/statistical/day_active/ # 日活跃用户统计url(r^statistical/day_active/$, statistical.UserActiveCountView.as_view()), 请求参数&#xff1a; 通过请求头传递jwt token数据。 返回数据&#xff1a; J…

中创|没人比我更懂!马斯克发出警告:人类要小心人工智能

马斯克在过去十年对AI的态度一直非常鲜明&#xff0c;很早就对这个问题有深入地思考&#xff1a; 2014 “我们对AI要非常小心&#xff0c;这可能是我们最大的存在威胁。” 2016 “AI的未来发展方向可能并不乐观&#xff0c;起码不会所有结果都是好的。” 2017 “AI会比地…

被培训班割韭菜,还期待高薪入场,哥们醒醒

刚毕业&#xff0c;两眼一抹黑&#xff0c;觉得前端高薪便急忙入场&#xff0c;可能一开始这条路就是错的。 1. 就在今天早晨07:53&#xff0c;有人要添加我的微信好友。现在基本上有人加我微信&#xff0c;我都是秒通过的&#xff0c;因为绝大部分加我wx的&#xff0c;都是从我…

如何看待培训机构出来的非科班程序员

看着身边的同学和朋友的情况&#xff0c;有感而发&#xff0c;打算从各方面角度说一说这件事。 近几年&#xff0c;互联网创业潮让IT技术人员的需求大大增加&#xff0c;各类IT培训机构风生水起&#xff0c;办得如火如荼。大多培训机构都是以保底工资nk&#xff0c;年薪轻松上…

腾讯XR,为什么凉了

深燃&#xff08;shenrancaijing&#xff09;原创 作者 | 李秋涵 编辑 | 魏佳 大厂的业务线&#xff0c;从成立到部分解散能有多快&#xff1f; 最近有一个新答案是&#xff0c;8个月。 2月16日下午&#xff0c;腾讯XR&#xff08;扩展现实&#xff09;业务线员工李钢铁还是先通…

两个offer:一个996,月薪3万;一个885,月薪2万,怎么选?

转载自&#xff1a;架构师社区 找工作时&#xff0c;钱和闲&#xff0c;你选哪个&#xff1f; 一位网友拿到了两个offer&#xff0c;一个996&#xff0c;月薪3万&#xff0c;一个885&#xff0c;月薪2万&#xff0c;怎么选&#xff1f; 一部分网友选择885&#xff0c;因为自己是…

科技巨头Facebook推出能自由对话的机器人,技术远超GPT-3

距离现在差不多一年前的光景&#xff0c;一款叫做BB1.0&#xff08;BlenderBot 1.0&#xff0c;后文简称BB1.0&#xff09;的人工智能机器人被Facebook创造了出来。 点击下方链接&#xff0c;自测是否符合美国百年理工强校在线计算机硕士入学申请资格&#xff0c;和线下一样的师…

Python美股量化交易填坑记录——13a.Vegas隧道交易机器人

目录 1.背景和目标 2.算法介绍 3.机器人参数 4.实盘测试&#xff08;进行中&#xff09; 第1天实盘&#xff1a;10月6日&#xff0c;周三 第2天实盘&#xff1a;10月7日&#xff0c;周四 第3天实盘&#xff1a;10月8日&#xff0c;周五 第4天实盘&#xff1a;10月11日&…

和众视野加入飞桨技术伙伴计划,共同推动纺织行业智能化转型

近日&#xff0c;北京和众视野科技有限公司正式加入飞桨技术伙伴计划&#xff0c;双方将共同努力开发AI视觉检测技术和机器人流程自动化相结合的系统解决方案。 北京和众视野科技有限公司 北京和众视野是一家实验室检测仪器及解决方案供应商&#xff0c;一直专注于视觉检测和检…

【MES】聚酯,纺丝,假捻的工艺路线

聚酯工艺路线(PET) PET(聚对苯二甲酸乙二醇酯)中文称聚酯,俗称涤纶树脂、聚酯切片。 聚酯的主工艺路线为聚酯到切片。 聚酯无子工艺路线。 聚酯使用的原料,就是上面提到的回收的PET瓶片,他们本身就是聚酯塑料瓶。 因此不需要经过酯化反应,只需要清洗,筛选,去杂,然后…

【2023/05/08】雅卡尔织布机

Hello&#xff01;大家好&#xff0c;我是霜淮子&#xff0c;2023倒计时第3天。 Share The world puts off its mask of vastness to its lover. It becomes small as one song,as one kiss of the eternal. 译文&#xff1a; 世界对着它的爱人&#xff0c;把它浩瀚的面具揭…

计算机毕业设计作品

计算机毕业设计作品统计 ①C语言项目源码大全&#xff08;60套&#xff09;②Android项目源码&#xff08;168套&#xff09;③计算机专业精选代码lun文&#xff08;26套&#xff09;④计算机专业-VB&#xff08;350套&#xff09;⑤计算机专业-PHP&#xff08;76套&#xff09…

【毕业季·进击的技术er】大学生计算机毕业设计应该这样写

活动地址&#xff1a;毕业季进击的技术erhttps://marketing.csdn.net/p/f4a818f6455f3a9a7a20c89f60ad35f7 目录 扉页 摘要 目录 一 绪论 二、相关技术环境介绍 三、系统需求分析 四、系统架构设计 五、系统实现 六、系统测试 致谢 参考文献 以一个过来学长的角度来看…

某高校毕业设计-数据分析课题技术实现篇

文章目录 某高校毕业设计-数据分析课题技术实现篇1.确定分析目标2.初步判断数据研判数据2.1能不能找到数据-->可以找到2.2分析指标2.2.1 指标1 各个老师的毕设通过率2.2.2 指标2 每年的毕设重修人数2.2.3 各个学院每年答辩通过率2.2.4 指标new2.2.15 指标new 2.3 基于需要分…

计算机专业毕业论文写作指导(案例超详解)

【辰兮要努力】&#xff1a;hello你好我是辰兮&#xff0c;很高兴你能来阅读&#xff0c;昵称是希望自己能不断精进&#xff0c;向着优秀程序员前行&#xff01; 博客来源于项目以及编程中遇到的问题总结&#xff0c;偶尔会有读书分享&#xff0c;我会陆续更新Java前端、后台、…

计算机专业毕业设计大纲,附源码+论文+答辩

毕设论文答辩通关法则&#xff0c;看这一篇&#xff0c;源码都在下面了&#xff01;写在前面&#xff0c;尽管论文方法和毕设源码都有&#xff0c;但还是要看课自己敲完完善好。做好充分准备面对答辩。 文章目录 一、毕设二、论文 2.1 论文标题2.2 确定论文大纲2.3 论文内容 2.…

【计算机毕业设计】38.网上轰趴预订系统

一、系统截图&#xff08;需要演示视频可以私聊&#xff09; 摘要 在网上轰趴发展的整个过程中&#xff0c;网上轰趴预定担负着最重要的角色。为满足如今日益复杂的管理需求&#xff0c;各类网上轰趴程序也在不断改进。本课题所设计的网上轰趴预定系统&#xff0c;使用SSM框架…

计算机毕业论文选题推荐|软件工程|系列九

文章目录 导文题目导文 计算机毕业论文选题推荐|软件工程 (***语言)==使用其他任何编程语言 例如:基于(***语言)门窗账务管理系统的设计与实现 得到:基于JAVA门窗账务管理系统的设计与实现 基于vue门窗账务管理系统的设计与实现 等等 题目 基于(***语言)学生在校信息管…

40套计算机毕业设计项目合集【含源码+论文】

前言 &#x1f525; 这两年开始毕业设计和毕业答辩的要求和难度不断提升&#xff0c;传统的java web缺少创新和亮点&#xff0c;往往达不到毕业答辩的要求&#xff0c;这两年不断有学弟学妹告诉学长自己做的java web管理系统达不到老师的要求。 为了大家能够顺利以及最少的精…

计算机毕业设计看这篇就够了(二)毕设流程

本篇将为大家介绍计算机专业毕业设计流程&#xff0c;提前了解毕设流程可以让同学们从宏观角度去看毕设要做些什么样的事情&#xff0c;大概知道每个阶段要去做哪些工作&#xff0c;为后续毕设任务的真正开展打下心理预期&#xff0c;也不至于一脸懵。 计算机毕设分为以下主流程…