浅对boss直聘上广州的数据分析岗位发布情况进行分析

1.项目背景

马上就要出去实习了,想对广州各个区数据分析岗位做一个了解,看看自己成为一名数据分析师还需要学习哪些技能还有了解广州各区数据分析岗位薪资如何。

2.研究问题

(1)广州哪个区的数据分析岗位招的最多?

(2)广州各个区的薪资最低是多少?

(3)公司招人需要应聘者具备哪些技能?

(4)公司招人他们的学历和工作经验是怎样的?

目录

一. 数据采集

二. 数据清理

三. 数据可视化及分析

一. 数据采集

这里我们通过采集器对boss直聘网进行数据的采集

首先,我们在网上打开boss直聘,在里面搜索数据分析,然后复制网址到采集器里。

爬出我们想要的数据后我们点击“开始采集”即可,这里总共采集了三百条数据,对应得上网页里的数据(网页中boss直聘里每页有30条,一共10页)

数据采集完成后我们把数据导出即可。

 我们看看导出后的数据,在这里我们把不需要的字段进行删除,比如标题链接,缩略图。然后再将列名称进行修改。

 修改完之后是这样的,完成这一步后我们就可以进行数据清洗了。

二. 数据清洗

这里我用到的工具是tableau prep builder

打开tableau prep builder,然后点击“连接到数据”,选择Microsoft Excel,导入我们的数据。

 

 导入数据后,按如图的步骤依次点击

我们先对薪资范围进行清洗,我们可以看到【薪资范围】里的数据是不统一的,这里我们要把它们进行拆分然后创建一个计算字段来统一它们的格式,我们把它们统一为按月发放多少K。

第一步:拆分

我们把后面的13薪,15薪,16薪什么的单独拆分出来。

选中薪资范围,右击选择“拆分值”选里面的自定义拆分。

 里面的内容按照如图,点击“拆分即可”

拆分完以后是这样的,这里我们把他们改一下名方便后续操作。

然后我们再吧把【薪资范围待清洗】里面的数据再进行拆分,把/后面的字拆开,操作如下:

然后得到下面两个字段,这里圈起来的部分我们把它命名为月,双击即可命名,因为除了按天发放工资那么剩下的就是按月发放了。然后再重新命名这两个字段,分别为【薪资范围待清洗2】和【发放频率】。

接下来我们再把【薪资范围待清洗2】里面的薪资单位取出来,点击创建计算字段,把计算1改为“薪资单位”,然后在里面写RIGHT([薪资范围待清洗2],1),代码的意思是得到【薪资范围待清洗】右边的第一个字。

拆分完后是这样的,然后我们再把【薪资范围待清洗2】进行拆分,这次我们按-来进行拆分,拆分完后把新拆出的两个字段分别命名为【薪资下限待清洗】和【薪资上限待清洗】。

 搞完之后 我们点击【薪资上限待清洗】旁边的这三个小点,选中“清理”点击移除字母。

 这样我们就把【薪资上限待清洗】里面的字母和文字清理干净了,然后我们就可以创建计算字段来处理薪资下限和上限的问题,由前面的数据我们知道,有些公司它的薪资是按每小时多少元发的有些则是按月发的,我们需要做的是把它们统一改为按月发多少K。

在此之前我们要把【薪资下限待清洗】和【薪资上限待清洗】转为整数,点击左上角的“Abc”,再点击“数字(整数)”即可

 

 创建计算字段,名为薪资下限,里面的代码为:

IF [发放频率] = "月" AND [薪资单位] = "K" THEN [薪资下限待清洗]
ELSEIF [发放频率] = "月" AND [薪资单位] = "元" THEN [薪资下限待清洗] / 1000
ELSEIF [发放频率] = "天" AND [薪资单位] = "K" THEN [薪资下限待清洗] * 30
ELSEIF [发放频率] = "天" AND [薪资单位] = "元" THEN [薪资下限待清洗] *30 / 1000
ELSE -1000000000 END

代码的含义是:

  • 如果“发放频率”为“月”,且“薪资单位”为“K”(千元),则将“薪资下限待清洗”的值直接作为结果输出。
  • 如果“发放频率”为“月”,且“薪资单位”为“元”,则将“薪资下限待清洗”除以1000,将单位转换为千元后输出。
  • 如果“发放频率”为“天”,且“薪资单位”为“K”(千元),则将“薪资下限待清洗”乘以30,将发放周期转换为月后输出。
  • 如果“发放频率”为“天”,且“薪资单位”为“元”,则先将“薪资下限待清洗”乘以30,再将结果除以1000,将单位转换为千元后输出。
  • 如果以上条件均不满足,则输出-1000000000

代码写好之后点击保存即可,然后再创建一个计算字段,名为【薪资上限】里面的代码也是差不多的,不过要修改一下,把里面的[薪资下限待清洗]改为[薪资上限待清洗]。

 搞好之后就是这样

 我们来确认一下,第一行数据是150-250/元每天,那么150*30就是4.5K的薪资下限,上限就是250*30也就是7.5K,对应得上我们刚刚创建的计算字段的结果,完全没毛病。

 然后我们再把之前拆分出来没用的删除,只留下下面的字段,然后再把这些字段排到你想要的位置。

 接下来,我们再把【经验要求】和【学历要求】里面的内容进行分组,如图,按住“Ctrl”选中下面五个(选完后就可以松开Ctrl了),然后在“经验不限”这里右键点击“将值分组”即可,【学历要求】也是一样的操作。

 分完之后就是这样的。

 然后我们看到【融资情况】和【公司规模】,这里我们看到【公司规模】里的null值都落在了【融资情况】里,这里我们要做一个字段偏移。

 创建计算字段,如下,点击保存。

 这样在【公司规模新】里就没用空值了,然后把【公司规模】删除即可。

 到这里,数据的清洗就完成了,将清洗后的数据导出即可。操作如下:

在输出类型选择我们要的xlsx文件

 

 然后在工作表里填上sheet1,并点击创建新工作表

 点击浏览,把你最后输出的文件放到你想要的位置上即可,最后点击“运行流程”就可以了.

 

三. 数据可视化及分析

这里我用的是tableau进行数据可视化的,作图的过程就不细说了,不会的可以看b站上面tableau的教程非常简单。

1.

 分析:我们可以明确地看到在广州各个区薪资上限平均值最高的是荔湾区,其次是海珠区,而薪资下限平均值最高的是海珠区,其次是荔湾区。这里很多人会问为什么薪资下限和上限平均值最高不是天河区,原因是天河区招聘的人数太多的,工资高的低的都有,所以平均薪资就没那么多了。

2.

分析:我们可以知道在广州,数据分析这个岗位70%要的都是本科生,其次是大专16.7%,硕士5.0%。

3.

 分析:我们知道,广州的天河区对数据分析这个岗位的需求是最大的,达到37.4%,毕竟天河区是广州最繁华的社区了,所以我们投简历的时候可以多往天河区投。

4.

 分析:我们可以知道,数据分析岗位你得具备sql,excel,python等技术才有优势,这是绝大数公司招聘条件,目前想成为数据分析师但还没方向的同学可以参考。

 5.

 分析:可以看到,在各个区里经验要求在1-3年,3-5年有超过一半以上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/30789.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python基于大数据的boss直聘数据招聘职位分析系统django

本项目主要利用python技术爬取BOSS直聘网站上的岗位信息,进行对比分析UI设计师与产品经理两个职位的趋势。爬取字段:工作地点,薪资范围,学历要求,工作经验,公司性质等。 模拟登陆BOSS直聘网站,爬…

Boss直聘招聘数据分析岗位小分析

嗨喽! 大家好,我是“流水不争先,争得滔滔不绝”的翀,18双非本科生一枚,正在努力!欢迎大家来交流学习,一起学习数据分析,希望我们一起好好学习,天天向上,目前是小社畜一枚…

Boss直聘招聘数据分析-202104月版

西安boss直聘4月招聘信息分析 关于boss直聘数据采集可查看另一篇文章《Boss直聘数据采集及分析》 金三银四,一年里比较火热的招聘季即将结束,那么西安软件开发行业截止目前还剩余的招聘岗位都还有哪些呢,近期在查看boss站点的时候就顺手…

chatgpt赋能python:Python函数拟合:理解、应用和优化

Python函数拟合:理解、应用和优化 Python是一种广泛使用的高级程序设计语言,它具有简单易学、开放源代码、跨平台、扩展性强等特点。在数据科学领域,Python是数据分析和建模的重要工具之一。其中,Python的函数拟合库具有重要的地…

交易猫源码+后台搭建教程

教程:修改数据库账号密码直接使用\n\n程序:https://pan.baidu.com/s/16lN3gvRIZm7pqhvVMYYecQ?pwd6zw3

《魅魔succubus》 来自韩国3d建模师 yeonghee cho

作品《魅魔succubus》 来自韩国3d建模师 yeonghee cho~~~ 或许你还想了解这些内容: 文章推荐阅读 【 学习企鹅圈:1072172722 】 : 3d建模什么水平能找到工作?次世代游戏建模需要学多久 3D建模师薪资怎么样? 室内设计建模6k&a…

浅浅分析一下Retrofit

浅浅分析一下Retrofit 文章目录 浅浅分析一下Retrofit简单介绍示例根据接口创建Java接口:创建retrofit对象,并生成接口实现类对象 注解请求类注解参数类注解标记类注解注解解析 好处 ​ 要想实现和服务器的通信,我们需要使用通讯间的协议来进…

浅浅分析滤波器截止频率

截止频率是描述滤波器性能的一个指标。对于一个滤波器,在其输入信号幅度保持不变的情况下,只改变输入信号的频率,当其输出信号幅度下降为输入信号幅度的0.707倍时,此时的频率即为该滤波器的截止频率。 一、理论分析 对于上图所示…

浅浅的介绍一下STL

1.什么是STL STL 全称 (Standard Template Library),就是标准模板库,说人话就是C标准里帮我们写好了一些经常用到的东西,其中包括容器(就是存东西的)、算法(例如之前学过的sort )、迭代器&#…

浅浅的计算机网络知识

目录 计算机网络(连接分散计算机设备以实现信息传递的系统)_百度百科 传输协议 传输层次 通信 计算机网络协议分层结构 开放系统互连参考模型的特点 IPv4协议 IPv6协议 FTP HTTP 网络传输协议 较为系统框架 先面向百度搭建理解框架 计算机网…

浅浅理解一下堆

目录 一、堆的定义及本质 二、堆的核心操作 1、向下调整 2、堆的创建 3、向上调整 三、堆的比较器传入及堆中简单函数的实现 四、堆的应用 1、用于OS调度进程 2、topk问题 3、堆排序 一、堆的定义及本质 堆在Java中是以优先级队列来表现的(PrityQueue&#…

浅浅的复习一下sql

DISTINCT 语法: SELECT DISTINCT 列名称 FROM 表名称1、现在有一个表如下: 2、执行sql语句-1 SELECT DISTINCT ename,email FROM emp 结果: 说明:由于小刘的ename和email重复了,所以结果只显示一次! 3…

浅浅仿制一个APP首页

一、实验目标 做一个APP首页,包括顶部图片、顶部菜单栏、中部消息模块、底部Tab按钮。学习 ScrollView, RelativeLayout,以及插件之间的穿插使用。 二、实验步骤 列出实验的关键步骤、代码解析、截图。 1.逻辑梳理 做一个app首页,包括顶部…

花嫁之容氏浅浅最后怎么样了_花嫁之容氏浅浅章节目录阅读

花嫁之容氏浅浅小说完整版无弹窗在线阅读。花嫁之容氏浅浅小说是作者:许暖暖创作完成的一本热门玄幻灵异小说,主要讲述女主舒浅和鬼王容祁两人的精彩故事。梦里,舒浅感受到一双冰冷的手在自己身上游走,可是即使这样,舒…

干货文章 | 低代码真的有价值吗?

作者:瀚码技术钟惟渊(第⼀作者)、独⽴顾问王甲佳(第⼆作者)、瀚码⼀⼑云叨叨AI助⼿(第三作者) 全文共4912字,阅读约需要15min 本系列文章由瀚码技术钟惟渊构思、制定大纲、组织了关…

零信任落地实践【新世界】

🌕写在前面 🎉欢迎关注🔎点赞👍收藏⭐️留言📝 ✉️今日分享: 莫道前路多险阻,再闯关山千万重 🍀 前言 轻舟已过万重山,始终不忘初心。在网络安全领域,我们…

神龙显灵-走进中国传统节日二月二龙抬头

二月二龙抬头,是中国传统的节日之一,也是春节的收官之战。这个节日被视为一个转折点,标志着春天的到来,也为农民们带来了新的希望和期待。 二月二这个日子有很多习俗和传说,其中最著名的就是“龙抬头”。据传说&#…

盘古大模型,让人人实现数字人自由

编辑&#xff1a;阿冒 设计&#xff1a;沐由 就在华为开发者大会2023 < HDC.Cloud 2023 > 正式开启的前夜&#xff0c;一则重磅消息从海外传来&#xff1a; 国际顶级学术期刊《自然》&#xff08;Nature&#xff09;杂志正刊发表了华为云盘古大模型研发团队研究成果——《…

奥运礼服设计师:AIGC 让童装设计从绿皮车进入高铁时代

近日&#xff0c;由温州 AIGC 产业联盟、温州市服装商会共同发起的“首届温州鞋服产业 AIGC 设计大赛”活动正如火如荼进行。大赛聚焦 13 岁青少年服饰设计这一行业存在已久的难题&#xff0c;探讨如何利用 AIGC 热门工具解决青少年服装设计痛点。据巴比特了解&#xff0c;该活…

每日互动(个推)CTO叶新江:AIGC时代,大模型推动数据要素商业化

ChatGPT在一夜之间火爆互联网&#xff0c;让AIGC受到世界范围内的高度关注。时至今日&#xff0c;AIGC热度持续高涨&#xff0c;各大互联网公司争相布局这一领域。日渐成熟的技术、显著的降本增效优势以及日益增长的市场需求等因素&#xff0c;已经推动AIGC成为互联网公司新一轮…