数据分析案例-数据分析师岗位招聘信息可视化

 3f6a7ab0347a4af1a75e6ebadee63fc1.gif

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


c8b58593a420415a85a0efcaa4a151dc.png

目录

​编辑

1.数据集介绍

2.实验工具

3.实验过程

3.1加载数据

3.2数据预处理

3.3数据可视化 

3.3.1工作经验要求

3.3.2学历要求

3.3.3公司规模

3.3.4不同城市的岗位数量

3.3.5岗位需求量最高的前十名公司

3.3.6平均薪资的分布情况

3.3.7校招和社招的占比

3.3.8不同工作年龄的平均薪资差异

3.3.9不同城市的平均薪资

3.3.10公司福利词云图

3.3.11分析哪种行业最火

3.3.12数据分析岗位需要的技能

4.总结


 

1.数据集介绍

本次实验数据集来源于xx招聘网中关于数据分析师相关岗位的招聘信息,共计1600条数据,每条招聘信息包括岗位名称、公司、薪资、城市、工作类型、学历要求、工作经验要求等共51个字段。

2.实验工具

python3.10

jupyter notebook

3.实验过程

3.1加载数据

首先导入本次实验用到的第三方库并读取数据

4a2171726c1c4a03971e12cb61e56ad8.png

b63e91d8eab64071bbb9e250aac6b2af.png

 查看数据大小

78476144c84a4e6289999d984484635b.png

查看数据基本信息

242649caa438427f8fb08c8820a4de53.png

3.2数据预处理

筛选出有价值可分析的变量

a1af75efaea340e19af9c656be2b930b.png

 统计缺失值情况

3698c00b15c54ea3884781dda8b207da.png

删除缺失值

3e2e5f0c332d4e8cb6d1b9c7e512e563.png

检测数据是存在重复值,若存在则删除

92d96f62d43c4625be69fd7d08a0a068.png

 处理薪资范围,转化为平均薪资

e4c1fbd318184e4bb06af1e1886a0e6e.png

3.3数据可视化 

3.3.1工作经验要求

# 工作经验要求
df1 = df['workYear'].value_counts()
a1 = Pie(init_opts=opts.InitOpts(theme = ThemeType.DARK))
a1.add(series_name='工作经验要求',data_pair=[list(z) for z in zip(df1.index.to_list(),df1.values.tolist())],radius='70%',)
a1.set_global_opts(title_opts=opts.TitleOpts(title="工作经验要求占比",pos_left='center',pos_top=30))
a1.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger='item',formatter='{a} <br/>{b}:{c} ({d}%)'))
a1.render_notebook()

dc5d1ba1266e45a2838ee8dbe0b56534.png

 可看出绝大部分都是要求5年以内,不限的很少。

3.3.2学历要求

# 学历要求
df2 = df['education'].value_counts()
a2 = Pie(init_opts=opts.InitOpts(theme = ThemeType.CHALK))
a2.add(series_name='学历要求',data_pair=[list(z) for z in zip(df2.index.to_list(),df2.values.tolist())],radius='70%',)
a2.set_global_opts(title_opts=opts.TitleOpts(title="学历要求占比",pos_left='center',pos_top=30))
a2.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger='item',formatter='{a} <br/>{b}:{c} ({d}%)'))
a2.render_notebook()

96e477e2e9a34611a4afa718d93fa4ff.png

 学历方面绝大部分都是本科以上即可。

3.3.3公司规模

# 公司规模
df3 = df['companySize'].value_counts()
a3 = Pie(init_opts=opts.InitOpts(theme = ThemeType.ESSOS))
a3.add(series_name='公司规模',data_pair=[list(z) for z in zip(df3.index.to_list(),df3.values.tolist())],radius='70%',)
a3.set_global_opts(title_opts=opts.TitleOpts(title="公司规模占比",pos_left='center',pos_top=30))
a3.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger='item',formatter='{a} <br/>{b}:{c} ({d}%)'))
a3.render_notebook()

f3a8ad45376c4831be870f228c12534b.png

 公司人数规模方面主要集中在500人以上,以中大厂为集中。

3.3.4不同城市的岗位数量

# 分析不同城市的岗位数量
df['city'].value_counts()[::-1].plot(kind='barh')
plt.xlabel('数量')
plt.ylabel('城市')
plt.title('不同城市的岗位数量')
plt.show()

498e8307bbff45be9976ab1f384b98f3.png

 可以看出数据分析相关岗位数量最多的是北上深广等沿海城市。

3.3.5岗位需求量最高的前十名公司

# 分析岗位需求量最高的前十名公司
df['companyShortName'].value_counts().head(10)[::-1].plot(kind='barh')
plt.xlabel('数量')
plt.title('岗位需求量最高的前十名公司')
plt.show()

11bed52cfd964a49a2194a54ca52dfa8.png

岗位需求量最多是腾讯、拼多多等互联网企业。 

3.3.6平均薪资的分布情况

# 分析平均薪资的分布情况
sns.distplot(df['avg_salary'])
plt.show()

96099fc5cab14197a4284aeac52115b8.png

从分布图看出平均薪资主要在10000-30000之间。 

3.3.7校招和社招的占比

# 分析校招和社招的占比
sns.countplot(data=df,x='isSchoolJob')
plt.xticks([0,1],labels=['社招','校招'])
plt.show()

9e922edd64dd4170af15f3f545e8055d.png

绝大多数都是社招,校招占据极少数。 

3.3.8不同工作年龄的平均薪资差异

# 分析不同工作年龄的平均薪资差异
sns.barplot(data=df,y='avg_salary',x='workYear')
plt.show()

c5d51efa29b94a51adf71bd23d48c2bd.png

 除了不限以外,平均薪资都是随着工作经验年数的增加而增加。

3.3.9不同城市的平均薪资

# 不同城市的平均薪资
df.groupby('city').mean()['avg_salary'].plot(kind='barh')
plt.xlabel('平均薪资')
plt.title('不同城市的平均薪资')
plt.show()

8920e31f8d0d43e982b7ef7bf2227895.png  

可以看出北京上海杭州深圳平均薪资都在20k左右。 

3.3.10公司福利词云图

# 分析公司福利词云图
from pyecharts.charts import WordCloud
import collections
result_list = []
for i in data['companyLabelList'].values:for j in eval(i):result_list.append(j)
word_counts = collections.Counter(result_list)
word_counts_top = word_counts.most_common(100)
print(word_counts_top)
wc = WordCloud()
wc.add('',word_counts_top)
wc.render_notebook()

aa9a84e4425d407ea56a294643b421ee.png

 可以看出带薪年假和绩效奖金是最多的福利。

3.3.11分析哪种行业最火

# 分析那种行业最火
from pyecharts.charts import WordCloud
import collections
result_list = []
for i in data['industryField'].values:word_list = str(i).split(',')for j in word_list:result_list.append(j)
word_counts = collections.Counter(result_list)
word_counts_top = word_counts.most_common(100)
print(word_counts_top)
wc = WordCloud()
wc.add('',word_counts_top)
wc.render_notebook()

3695732da3474eb0859b5b64c24a4533.png

可以看出移动互联网、电商、数据服务、金融行业等比较火。 

3.3.12数据分析岗位需要的技能

# 分析数据分析岗位需要的技能
from pyecharts.charts import WordCloud
import collections
result_list = []
for i in data['skillLables'].values:for j in eval(i):result_list.append(j)
word_counts = collections.Counter(result_list)
word_counts_top = word_counts.most_common(100)
print(word_counts_top)
wc = WordCloud()
wc.add('',word_counts_top)
wc.render_notebook()

88df6049c6d84e2f96a64e7d55edb943.png

可以看出SQL、可视化、BI、Python、Hadoop、Hive等都是数据分析师必备的重要技能。 

4.总结

        本次通过对数据分析师相关岗位的分析,我们发现数据分析相关岗位主要集中在北上广深等城市,以中大厂为主,经验要求以1-5年为主,学历以本科以上为主,平均薪资在15k左右,技能方面以SQL、可视化、BI、Python、Hadoop、Hive为主。

心得与体会:

通过这次Python项目实战,我学到了许多新的知识,这是一个让我把书本上的理论知识运用于实践中的好机会。原先,学的时候感叹学的资料太难懂,此刻想来,有些其实并不难,关键在于理解。

在这次实战中还锻炼了我其他方面的潜力,提高了我的综合素质。首先,它锻炼了我做项目的潜力,提高了独立思考问题、自我动手操作的潜力,在工作的过程中,复习了以前学习过的知识,并掌握了一些应用知识的技巧等

在此次实战中,我还学会了下面几点工作学习心态:

1)继续学习,不断提升理论涵养。在信息时代,学习是不断地汲取新信息,获得事业进步的动力。作为一名青年学子更就应把学习作为持续工作用心性的重要途径。走上工作岗位后,我会用心响应单位号召,结合工作实际,不断学习理论、业务知识和社会知识,用先进的理论武装头脑,用精良的业务知识提升潜力,以广博的社会知识拓展视野。

2)努力实践,自觉进行主角转化。只有将理论付诸于实践才能实现理论自身的价值,也只有将理论付诸于实践才能使理论得以检验。同样,一个人的价值也是透过实践活动来实现的,也只有透过实践才能锻炼人的品质,彰显人的意志。

3)提高工作用心性和主动性。实习,是开端也是结束。展此刻自我面前的是一片任自我驰骋的沃土,也分明感受到了沉甸甸的职责。在今后的工作和生活中,我将继续学习,深入实践,不断提升自我,努力创造业绩,继续创造更多的价值。

这次Python实战不仅仅使我学到了知识,丰富了经验。也帮忙我缩小了实践和理论的差距。在未来的工作中我会把学到的理论知识和实践经验不断的应用到实际工作中,为实现理想而努力。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/62421.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据分析师岗位 分析可视化

目录 前言 一、导入模块 二、数据处理与分析 1.读取数据 2.查看数据表格描述 3.处理重复值 4.处理缺失值 5.提取地区信息 6.提取经验信息 7.提取薪资信息 三、Pyecharts数据可视化 1.每个地区的招聘数量 2.平均工资最高的地区 3.经验学历需求图 4.招聘公司所在…

文心千帆与文心一言API的使用

我在今年三月份左右申请了百度文心一言的测试&#xff0c;不久就通过了申请&#xff0c;体验了一段时间&#xff0c;感觉很棒&#xff0c;但是我更希望百度能早一点开放文心一言的API&#xff0c;不用在线去使用。 在7月19日那天&#xff0c;百度智能云给我打电话&#xff0c;问…

噫吁嚱!文言文亦能编程!此诚年度最骚语言也

栗子 晓查 发自 海边边 量子位 报道 | 公众号 QbitAI 同学&#xff0c;你可知如何用文言文输出“Hello World”&#xff1f; 请君睁圆双眼注视于此&#xff1a; △ 右边一顿输出 吾有一言。曰「「問天地好在。」」。書之。 却为何输出了三遍&#xff1f; 只因有for循环&#x…

60句高逼格的文言文,不收藏绝对是你的损失!

还记得前段时间火极一时的 “看到……应该想到” 系列吗&#xff1f; 由此可见国学早已渗透到生活的方方面面&#xff0c;关键时候还能映衬出你的儒&#xff08;liao&#xff09;雅&#xff08;mei&#xff09;高&#xff08;zhuang&#xff09;深&#xff08;bi&#xff09;。…

妙哉!那个用文言文编程的小哥,竟从28万行唐诗中找出了对称矩阵

梦晨 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 你能看出来&#xff0c;这首诗妙在哪里吗&#xff1f; 其实&#xff0c;横着读是一首诗&#xff0c;竖着读还是这首诗&#xff01; 而且&#xff0c;这首诗可不是乱编的&#xff0c;其中的诗句都来自《全唐诗》&#xff0c;…

文心一言 VS 讯飞星火 VS chatgpt (64)-- 算法导论6.5 3题

文心一言 VS 讯飞星火 VS chatgpt &#xff08;64&#xff09;-- 算法导论6.5 3题 三、要求用最小堆实现最小优先队列&#xff0c;请写出 HEAP-MINIMUM、HEAP-EXTRACT-MIN、HEAP DECREASE-KEY 和 MIN-HEAP-INSERT 的伪代码。 文心一言&#xff1a; 以下是使用最小堆实现最小…

chatgpt赋能Python-mac系统的python

在Mac系统上运行Python&#xff1a;一个简介 介绍 Python是一种流行的、易于学习的编程语言&#xff0c;被广泛用于各种用途&#xff0c;从数据分析到机器学习。如果您是Mac用户&#xff0c;那么您已经安装了Python&#xff0c;因为它是系统的一部分。本文将介绍如何在Mac系统…

微软 Copilot “杀疯了”,太刺激了...

1 刺激 这段时间真是太刺激了。 就在最近&#xff0c;微软宣布了 Copilots for Windows 11 以及其他一系列产品。作为AI助手&#xff0c;Windows Copilot将直接集成到Windows 11中&#xff0c;在所有应用和程序中都可使用&#xff0c;就像我们在Edge、Office程序和GitHub中看到…

GPT-4来了,计算机视觉科研,何去何从?

点击下方卡片&#xff0c;关注“CVer”公众号 AI/CV重磅干货&#xff0c;第一时间送达 点击进入—>【计算机视觉】微信技术交流群 作者&#xff1a;Mike Shou |&#xff08;已授权转载&#xff09;编辑&#xff1a;CVer https://zhuanlan.zhihu.com/p/616966879 最近上课被…

【chatGpt】关于websocket连接中对未授权的捕捉问题

目录 问题 有效提问 有效的细节提问 问题 一路上&#xff0c;通过简单的error进行判断弹出授权&#xff0c;会有很多乱弹的现象&#xff1a; &#xff08;1&#xff09;链路正常切换会断 &#xff08;2&#xff09;服务器没有启动会连接不上 &#xff08;3&#xff09;没…

Vscode 用MarkDown画流程图

效果图 start>start: 开始 input>inputoutput: 输入 operation>operation: 操作 condition>condition: 操作出错&#xff1f; output>inputoutput: 输出 error>operation: 请重新输入 end>end: 结束start->input input->operation operation->co…

chatgpt赋能python:Python画图设置背景颜色

Python画图设置背景颜色 在Python中使用Matplotlib和Seaborn等库来生成数据可视化图表非常方便。但是&#xff0c;这些图表默认使用白色背景。有时&#xff0c;我们需要在制作图表时更改背景颜色以匹配我们的主题或品牌标识。本文将介绍如何在Matplotlib和Seaborn中设置不同的…

chatgpt赋能Python-python3如何画图

Python3如何画图&#xff1f; Python是一种高级编程语言&#xff0c;它有着多种用途&#xff0c;包括数据分析和可视化。Python3是Python的最新版本&#xff0c;它具有更好的性能和易用性。在这篇文章中&#xff0c;我们将介绍如何使用Python3来画图&#xff0c;并探讨其优势和…

chatgpt赋能python:Python画图坐标轴大小

Python画图坐标轴大小 Python是一种广泛使用的编程语言&#xff0c;它在科学计算和可视化方面得到了广泛的应用。在可视化中&#xff0c;坐标轴的大小和比例对于展现数据的真实性和清晰性至关重要。在本文中&#xff0c;我们将介绍如何使用Python画图坐标轴大小&#xff0c;并…

“烧钱”的大模型:初探成本拆解与推理优化方法

编者按&#xff1a;大模型的成本问题一直以来是大家重点关注的问题&#xff0c;本文重点讨论了训练大型语言模型&#xff08;LLMs&#xff09;需要的成本&#xff0c;并简要介绍什么是LLM以及一些用于优化大模型推理表现的技术。 虽然很难准确预测LLMs未来会怎么发展&#xff0…

Spring Cloud 优惠最后 1 天!

大家好&#xff0c;我是栈长。 关注了一段时间公众号的小伙伴都知道&#xff0c;栈长的 Spring Cloud 微服务课程每月都会给小伙伴搞一波活动。 61活动来了&#xff0c;很多小伙伴都在等 61 的活动&#xff0c;这次活动&#xff0c;福利全新升级&#xff0c;千万不要错过&#…

微信公众号文章是否违规怎么检测?

在写文章的时候&#xff0c;会遇到以下3种情况&#xff1a; 1、你所编辑的图文消息可能含有敏感内容&#xff0c;你可以继续保存或发布该图文消息&#xff08;发布等待时长约3-4小时&#xff09;&#xff0c;若保存或发布后&#xff0c;经核实含有敏感内容的&#xff0c;将可能…

如何发现并分析APP个人信息收集是否违规?

移动互联网的发展以及智能终端的兴起&#xff0c;手机已然成为了我们生活中不可或缺的“日用品”&#xff0c;各种手机APP开启霸屏模式&#xff0c;例如常见的支付APP、聊天APP、金融APP、交通APP等&#xff0c;这些APP虽然给我们生活带来了便利&#xff0c;但是其收集的用户信…

新闻稿的制作流程:从确定新闻稿目的到将其分发给媒体

对于任何希望向媒体和公众传达具有新闻价值的信息的组织来说&#xff0c;新闻稿都是必不可少的工具。精心制作的新闻稿可以帮助您宣传您的业务、产品或服务&#xff0c;并可以产生有价值的媒体报道。在本文中&#xff0c;我们将指导您完成新闻稿的制作过程&#xff0c;从确定新…

如何写新闻稿?写好新闻稿的技巧与步骤

新闻稿是传递新闻事件和信息的重要手段&#xff0c;是传媒工作中不可或缺的一部分。写好一篇新闻稿可以让受众了解更多信息&#xff0c;进一步提高他们的关注度。以下是一些写好新闻稿的技巧和步骤&#xff0c;帮助你有效地传达新闻。 1、确定新闻的核心信息 在开始写新闻稿之前…