python 数据分析面试题：求分组排第n名的记录数据

近期面试遇到一个面试题，分享给大家。
文中会提供详细的解题思路以及问题延伸

一、面试题

面试题：输出各学科总分第一名的学员姓名、年龄、分数
数据：

class_a= {'name': ['学员1', '学员2', '学员3', '学员4','学员5'],'age': [23, 24, 26, 27,25],'course_subject': ['数学', '英语', '语文', '语文','数学'],'score': [100,50,40,30,99]}class_b= {'name': ['学员6', '学员7', '学员8', '学员9'],'age': [23, 24, 26, 27],'course_subject': ['数学', '数学', '语文', '英语'],'score': [18,99,77,30]}

二、解题过程

字典转变为DataFrame，合并，重置索引

df_a = pd.DataFrame(class_a)
df_b = pd.DataFrame(class_b)
df = pd.concat([df_a,df_b])
df.reset_index(drop=True,inplace=True)

在这里插入图片描述

groupby分组 + labmda函数得出结果

df.idxmax() ：该函数作用是返回每一列中最大值的索引（所以为什么前文的数据处理中需要重置索引）。

df.groupby('course_subject').apply(lambda x: x.loc[x['score'].idxmax(), ['name', 'age', 'score']])

在这里插入图片描述

延伸：df.idxmin() 取最小

df.nlargest()：返回指定列排序后的前 N 个最大值所对应的行。

df.groupby('course_subject').apply(lambda x: x.nlargest(1, 'score'))[['name','age']]

在这里插入图片描述

注意⚠️：遇到相同值的情况，返回结果可能与预期不一致，如原数据中，数学成绩=99的有两位学员，此时当n=2时，只返回其中一位学员的记录；n=3才会返回两位学员的记录数。
所以，如果某一课程中，有两位学员都获得100分，那么此方法并不能解决该面试题。
在这里插入图片描述 (n=2)

df.rank()：排名函数

df.groupby('course_subject').apply(lambda x:x.loc[x['score'].rank(ascending=False,method='min')==1,['name', 'age', 'score']]
)

在这里插入图片描述
说明：method='min'主要是考虑遇到同值的情形，详解参考：python Pandas.rank() 排名函数详解

延伸：该方法可以延伸至求分组排名、分组排第n名的记录数据等问题，是比较完善的答案。

当然，还有其他解决方法，欢迎大家留言补充～

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/74198.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python 数据分析面试题：求分组排第n名的记录数据

一、面试题

二、解题过程

相关文章

05|Oracle学习（UNIQUE约束）

AB 压力测试

PHP从入门到精通—PHP开发入门-PHP概述、PHP开发环境搭建、PHP开发环境搭建、第一个PHP程序、PHP开发流程

无涯教程-Lua - 函数声明

什么？你还没有用过JPA Buddy，那么你工作肯定没5年

【论文阅读】通过解缠绕表示学习提升领域泛化能力用于主题感知的作文评分

【MySQL】表的增删查改

Python爬虫教程篇+图形化整理数据（数学建模可用）

【深度学习】High-Resolution Image Synthesis with Latent Diffusion Models，论文

ERROR 1064 - You have an error in your SQL syntax；

应用案例｜基于高精度3D视觉引导压缩机抓取定位应用

SpringBoot+ruoyi框架图片上传和文件下载

Compose应用案例（利用docker compose安装lnmp实例）

MQTT服务器详细介绍：连接物联网的通信枢纽

布隆过滤器

「干货分享」针对电机控制应用如何选择宽带隙器件？

【javaSE】实现图书管理系统

Jmeter自动化性能测试常见问题

视频爬虫：解析m3u8文件 python m3u8库，m3u8文件中.ts视频流的解密下载

什么是高级持续威胁(APT)攻击