数据分析案例-数据科学相关岗位薪资可视化分析

3f6a7ab0347a4af1a75e6ebadee63fc1.gif

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


目录

数据集介绍

可视化分析

 1.分析2023年排名前十的岗位

2.分析工作经验水平情况

3.分析雇佣类型情况

4.分析薪资最高的岗位

5.分析薪资最高的雇佣类型

6.分析平均薪资最高的年份

7.绘制公司分布热力地图

本期推荐

粉丝福利


 

数据集介绍

本数据集来源于kaggle,原始数据集共有3755条, 11列特征,各特征具体含义如下:

work_year:发工资的年份。
experience_level:该职位在一年内的经验水平
employment_type:角色的雇佣类型
job_title:这一年中工作的角色
工资:支付的工资总额
salary_currency:作为ISO 4217货币代码支付的工资的货币
salaryinusd:以美元计算的工资
employee_residence:作为ISO 3166国家代码,雇员在工作年度的主要居住国家
remote_ratio:远程完成的总工作量
company_location:雇主的主要办事处或承包分公司所在的国家
company_size:该年度为该公司工作的人数中位数

9fa30875f73f413dbdb644ef437b44c9.png

可视化分析

 首先导入本次可视化用到的第三方库,并使用pandas导入数据集

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
import seaborn as sns
import country_converter as coco
import warnings
warnings.filterwarnings('ignore')
sns.set_theme()
sns.set(rc = {"figure.figsize":(8,6)})df = pd.read_csv('ds_salaries.csv')
df.head()

ef8f467734404993b89bc6c6ad77e6eb.png

 1.分析2023年排名前十的岗位

# Top 10 Job Titles in 2023
jobs = df[df['work_year']==2023]['job_title'].value_counts().nlargest(10).reset_index()
fig, ax = plt.subplots()
ax = sns.barplot(ax = ax, data = jobs , y = jobs['index'], x = jobs.job_title)
ax.set(ylabel='Job Titles',xlabel='Counts', title='Top 10 Job Titles in 2023')
ax.bar_label(ax.containers[0], padding = 2)
plt.show()

e71732bd62ed47f689a81db2a5a62cfc.png

 正如您所看到的,数据工程师最多,其次是数据科学家和数据分析师。

2.分析工作经验水平情况

# Experience Levels
df['experience_level'] = df['experience_level'].replace('EN','Entry-level/Junior')
df['experience_level'] = df['experience_level'].replace('MI','Mid-level/Intermediate')
df['experience_level'] = df['experience_level'].replace('SE','Senior-level/Expert')
df['experience_level'] = df['experience_level'].replace('EX','Executive-level/Director')
fig, ax = plt.subplots()
sns.countplot(ax = ax, data = df, x = df.experience_level)
ax.set(xlabel='', ylabel='Counts', title='Experience Levels')
ax.bar_label(ax.containers[0])
plt.show()

5f3cf430967f4e139b0eb06f812056cd.png

 正如您所看到的,高级职位的计数最高,其次是中级和初级职位。与其他级别的职位相比,总监级别的职位更少。

3.分析雇佣类型情况

# Employment Types
df['employment_type'] = df['employment_type'].replace('FT','Full-Time')
df['employment_type'] = df['employment_type'].replace('PT','Part-Time')
df['employment_type'] = df['employment_type'].replace('CT','Contract')
df['employment_type'] = df['employment_type'].replace('FL','Freelance')
fig, ax = plt.subplots()
sns.countplot(ax = ax, data = df, x = df.employment_type, hue = 'experience_level')
ax.set(xlabel='', ylabel='Counts', title='Number of Employment Types')
ax.bar_label(ax.containers[0])
ax.bar_label(ax.containers[1])
ax.bar_label(ax.containers[2])
ax.bar_label(ax.containers[3])
plt.show()

7c0572a702ba478791b80b201a85bd87.png

 正如你所看到的,这里有相当多的人是全职工作。在全职员工中,大多数是高级员工。我们观察到自由职业现在不那么流行了。

4.分析薪资最高的岗位

# Salaries by Job Titles
job_title_salary = df['salary_in_usd'].groupby(df['job_title']).mean().round(0).nlargest(15).sort_values(ascending = False).reset_index()
fig, ax = plt.subplots()
ax = sns.barplot(ax = ax, data = job_title_salary , y = job_title_salary.job_title, x = job_title_salary.salary_in_usd)
ax.set(ylabel='Job titles',xlabel='Salary in usd', title='Top 15 Average Salaries by Job Titles')
ax.bar_label(ax.containers[0], padding = 2)
plt.show()

2b52a60e96a747099a4ab05937493433.png

 正如我们所料,一般在行政级别工作的人的平均工资要高一些。由于云计算的趋势,云数据架构师是收入第二高的职业。

5.分析薪资最高的雇佣类型

# Salaries by Employment Types
avg_salaries = df.groupby('employment_type')['salary_in_usd'].mean().round(0).sort_values(ascending = False).reset_index()
fig, ax = plt.subplots()
sns.barplot(ax =ax,data = df , x = 'employment_type', y = 'salary_in_usd',errorbar = None, hue = 'work_year')
ax.set(xlabel='', ylabel='Dollars', title='Average Salaries in Dollars Per Year')
ax.bar_label(ax.containers[3], padding = 2)
plt.show()

7b9262f8053a40b2969dbd94ff723859.png

 正如你所看到的,全职员工的平均工资多年来一直在增长。这表明公司关心数据科学。第二高的薪水属于自由职业者,这清楚地表明了自由职业者的增长趋势。

6.分析平均薪资最高的年份

# Salaries by Work Years
year_based_salary=df['salary_in_usd'].groupby(df['work_year']).mean()
plt.title("Average Salaries based on Work Year")
plt.xlabel('Work Year')
plt.ylabel('Salary')
sns.lineplot(x=['2020', '2021', '2022','2023'],y=year_based_salary)
plt.show()

73b490ec4f7f4babacccc22dc744a764.png

 正如你所看到的,数据驱动型工作的平均工资每年都在增长,在2021年到2022年之间的增幅尤其显著。这一趋势凸显了对该领域熟练专业人员的需求日益增长。

7.绘制公司分布热力地图

# Remote Jobs Locations
rr = df.groupby('company_location')['remote_ratio'].mean().reset_index()
rr['company_location'] =  coco.convert(names = rr['company_location'], to = "ISO3")
fig = px.choropleth(rr,locations = rr.company_location, color = rr.remote_ratio,                  labels={'company_location':'Country','remote_ratio':'Remote Jobs Ratio'})fig.update_layout(title = "Remote Jobs Locations")
fig.show()

5d86abb8ef764d4dac994d984c2a76d3.png

图片看不到的话,大家就自行运行吧。

本期推荐

《 Python自动化办公应用大全(ChatGPT版)》

01ae59a66db84c70b1ee7e9cce5c9e89.jpeg


内容简介:

        本书全面系统地介绍了Python语言在常见办公场景中的自动化解决方案。全书分为5篇21章,内容包括Python语言基础知识,Python读写数据常见方法,用Python自动操作Excel,用Python自动操作Word 与 PPT,用Python自动操作文件和文件夹、邮件、PDF 文件、图片、视频,用Python进行数据可视化分析及进行网页交互,借助ChatGPT轻松进阶Python办公自动化。 
        本书适合各层次的信息工作者,既可作为初学Python的入门指南,又可作为中、高级自动化办公用户的参考手册。书中大量的实例还适合读者直接在工作中借鉴。

粉丝福利

《Python自动化办公应用大全(ChatGPT版)》免费送书2本!

参与福利 

  • 抽奖方式:评论区随机抽取2位小伙伴免费送出!
  • 参与方式:关注博主、点赞、收藏、评论区评论“人生苦短,拒绝内卷!”(切记要点赞+收藏,否则抽奖无效,每个人最多评论三次!
  • 活动截止时间:2023-05-27 20:00:00

  当当自营店购买链接:http://product.dangdang.com/29566495.html

名单公布时间:2023-05-27 21:00:00   

0dfc31fed539450fb63311907f903168.png

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14129.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

码上行动:零基础学会Python编程

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

【JDK环境配置】| 两种JDK环境能在同一台电脑共存吗?

目录 🦁 前言🦁 基础环境🦁 安装JDK1.8Ⅰ. 下载Ⅱ. 安装 🦁 在项目里更改JDK版本---------------------------------------------福利在下面--------------------------------------------------🦁 福利(送…

【Azure】Azure 成本管理:规划、监控、计算和优化成本 | 文末送书

开篇先来一个不是总结的总结:平衡成本与性能始终是一个重大挑战。(此处省略各种场景的解释) 文章目录 前言一、Azure 成本管理工具1.1 什么是成本管理1.2 成本管理的主要功能 二、Azure 中可能影响成本的因素2.1 影响成本的因素2.1.1 资源类型…

『赠书活动 | 第八期』《ChatGpt全能应用一本通》

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ! 『赠书活动 | 第八期』 本期书籍:《ChatGpt全能应用一本通》 赠书规则:评论区:点赞|收藏|留言 …

使用 OpenAI 的 ChatGPT 提高开发人员的工作效率

💂 个人网站:【海拥】【摸鱼游戏】【神级源码资源网】🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】💅 想寻找共同学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】 介绍 作为一名开发人…

Chat GPT对社会生产结构产生的冲击力远大于 Alpha GO!

开年以来,Chat GPT的各种新闻一直不绝于耳,相信大家对Chat GPT的各类介绍也已经司空见惯了,或者说见怪不怪了,为什么这么说呢?因为现在关于Chat GPT的各类文章和视频,真真假假,虚虚实实&#xf…

chatgpt赋能python:Python音频降噪:如何利用Python降噪音频?

Python音频降噪:如何利用Python降噪音频? 随着音频技术的不断发展,音频处理已经成为了我们生活中不可或缺的一部分。在音频处理的过程中,降噪技术是非常重要的一环。Python作为一种高级编程语言,已经成为了音频降噪领…

chatgpt赋能python:如何用Python放音乐——实现简单的音频播放功能

如何用Python放音乐——实现简单的音频播放功能 介绍 Python作为一种高级编程语言,越来越受到程序员们的喜爱。它的强大和灵活性为我们提供了许多方便快捷的编程工具。例如,在日常生活中,我们需要播放一些音乐,这时如果用Python…

chatgpt赋能python:Python分离音频:优秀技术实践实现音频处理的最佳方案

Python分离音频:优秀技术实践实现音频处理的最佳方案 在音频处理领域中,Python一直被视为一个最实用和最便捷的工具。Python的音频处理库Pydub,是一个基于FFmpeg的简单API,具备提取音频、音频转换、音量控制、音频切片和合并、音…

发现最优秀的人工智能对话体验

Tomchat:点击传送 支持gpT 4 -3.5支持 midjourny绘画可长篇写作无使用月限额 wuguokai 这个网站是设计模式老师推荐的,不强制用户。并且满足毫秒级响应。 https://chat.wuguokai.cn AIDuTu 无需登录,直接使用,挺好的 https…

ChatGPT团队中,3个清华学霸,1个北大学霸,共9位华人

众所周知,美国硅谷其实有着众多的华人,哪怕是芯片领域,华为也有着一席之地,比如AMD 的 CEO 苏姿丰、Nvidia 的 CEO 黄仁勋 都是华人。 还有更多的美国著名的科技企业中,都有着华人的身影,这些华人&#xff…

chatgpt赋能python:Python如何断开Socket连接:

Python如何断开Socket连接: 介绍 Socket是一种网络通信协议,用于实现不同计算机之间的通信。Python提供了内置的socket库,使得用户能够在Python编程中使用Socket连接。 虽然Socket连接是一个有用的工具,但有时需要在需要时手动…

ChatGPT 打字机效果原理

一、背景 在初次使用 ChatGPT 时,我就被打字机的视觉效果吸引。总是感觉似曾相识,因为经常在一些科幻电影中看到,高级文明回传的信息在通讯设备的屏幕上以打字机效果逐步出现,在紧张的氛围下,输出人类可读的内容&…

ChatGPT调教指北

ChatGPT调教指北 ChatGPT某些对话需要通过特定的指示,才能让回复出满意的答案。以下是一些有趣且常用的调教信息。 如需更详细请查看:https://github.com/labi-xiaoxin/chatgpt-prompts-zh 如果还不会使用ChatGPT,请查看公众号【迷茫的21世纪…

我身边35+程序员,的真实现状,其实没那么惨...

1 不会笑青年 我和不会笑青年是在11年,第二家公司的时候遇到的,我们一起四个人同一天入职的,后来成为了四个好朋友。 今天就先拿,这4个人,给大家说说,他们现在都在干啥… 先聊不会笑青年吧,…

突破界限,解锁AIGC火爆出圈背后的驱动力

从2022年下半年开始,AI绘画工具Stable Diffusion、AI聊天机器人ChatGPT陆续在全球爆火,迭代速度更是呈现指数级发展,让普通用户直观感受到了AI技术的强大和AI技术发展的一日千里,也让AIGC逐渐接棒“元宇宙”成为全球关注的焦点和热…

AI可能造成人类灭绝,真的还是炒作?

作者 | 王瑞平 5月30日,一封由非营利组织人工智能安全中心(Center for AI Safety)发布的简短声明轰动了AI界,导致人工智能的地位可能会被动摇。 我们在该组织的官网上找到了这份声明。声明中仅有22个单词,却饱含了专家…

文心一言一把火,百度智能云盈利了!李彦宏诚不欺我?

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI 文心一言发布后,百度的首份财报来了。 先说结论:以文心一言为代表的大模型技术,正在给百度带来新的增长契机。 文心一言发布前,李彦宏就曾判断: 中国AI市场即将迎来爆发性的需…

警惕AI换脸技术:近期诈骗事件揭示的惊人真相

大家好,我是可夫小子,《小白玩转ChatGPT》专栏作者,关注AIGC、读书和自媒体。 目录 1. deepswap 2. faceswap 3. swapface 总结 📣通知 近日,包头警方公布了一起用AI进行电信诈骗的案件,其中福州科技公…

研报精选230215

目录 【行业230215开源证券】电力设备行业投资策略:特高压建设有望迎来高峰期,解决清洁能源跨区互济瓶颈 【行业230215浙商证券】计算机行业【AIGC算力时代系列报告】:ChatGPT研究框架 【个股230215国信证券_公牛集团】民用电工行业领军者&am…