《爬虫职海录》卷二 • 爬在广州

HI，朋友们好，「爬虫职海录」第二期更新啦！

本栏目的内容方向会以爬虫相关的“岗位分析”和“职场访谈”为主，方便大家了解一下当下的市场行情。

本栏目持续更新，暂定收集国内主要城市的爬虫岗位相关招聘信息，有求职和跳槽打算的小伙伴们，可以多多关注。

本期为广州篇！

这不马上就要过年了，每年这时候都有很多小伙伴按捺不住，想要跳槽或者观望观望。

这两年行情不好，大家转行or跳槽，都需要多做功课，慎重做决定。

本次我依然从招聘网站找来了300+份当前广州的爬虫岗位JD，数据不一定很全面，但保证很热乎~

若是能帮到大家，K哥荣幸之至，要是没啥用，那就权当看看图一乐！

（各大城市当前爬虫工程师岗位收入）

（各大城市当前爬虫工程师岗位需求）

要了解一个城市对于某一岗位的友好程度，是需要同比其他城市的，所以我一共找来了北上广深杭5个城市的相关数据做参照。

可以看到，目前广州的爬虫工程师们，平均收入为12269元，收入中位数是11500元，

同时根据已公布数据可知，广州市2023-2024年度的平均工资为11300元，大家可以自行对比对比。

数据很直观，相较其他一线城市，广州的岗位数量和工资水平确实没有优势。

下边我们再看看当下的实际招聘情况。

（广州当前爬虫岗位招聘薪资）

招聘信息上挂出的薪酬，月薪大多在10~15K这个大区间内，还满足你的要求吗？

另外K哥在收集招聘信息时，顺便为大家整理了一些关键词，包括公司行业、公司规模、岗位title、技能标签、学历要求、福利待遇等方面，兄弟们可以瞅瞅。

（广州爬虫岗位招聘信息词云图）

可以看到，“本科”、“20—99人”、“1—3年”、“年终奖”、“互联网”、“大专”、“五险一金”、“Sql”、“Java”、“python” 这些词在招聘jd里高频出现，反映了大部分公司当前的招聘情况。

K哥锐评—城市&岗位

guang zhou

岗位情况：★★★（3）

目前在一线城市中，广州的爬虫工程师相关岗位是最少的，岗位竞争压力相对较大。

但另一方面，工作经验在3年内就符合条件的岗位占比达到47.7％，相较于北京大量稀缺3-5年经验的爬虫工程师，广州对初级或者刚毕业的爬虫工程师会更加友好。

薪酬水平：★★★（3）

广州的爬虫岗工资确实不算高，但这只是相对其他几个一线城市而言，从另一方面来讲，已经跑赢了广州市的平均月薪啦。

城市潜力：★★★★（4）

尽管岗位数量和薪资水平都不占优，但大家还要看到，广州在吃住方面的生活成本同样是相对较低的，毕竟每个月工资再高，只有“可支配收入”才是真的。

况且“食在广州”、“气候宜人”也为广州的城市魅力加分不少~

综合得分：★★★★★★★★★★（10）

我认为，工资水平是选择城市&岗位的重要标准，但不会是唯一标准。

若你饮食清淡，不喜寒冷，那么广州应该是个还不错的选择！

广州丨爬虫岗位

（以下岗位为随机列举，信息来源——BOOS直聘）

探迹

-1000-9999人

-互联网 SaaS

地址｜广州海珠区智通广场C塔16层

爬虫开发

20-35K·14薪

职位详情：
1、发挥创造性思维，用专业技术攻坚数据采集与应用难题；
2、用技术赋能数据采集，帮助数据产品经理稳靠把握数据情况，确保数据更新快、准、全；
3、设计搭建大规模分布式爬虫系统、大规模APP采集系统，以及其他相关服务系统；
4、分析开发效率瓶颈，利用devops手段，实现爬虫采集工具化、自动化、平台化，提高爬虫团队生产效率；
5、使用容器化技术，解决系统自动化部署及爬虫资源分配问题。
任职要求：
1、本科以上学历，计算机相关专业，熟悉操作系统(多线程、多进程)、计算机网络编程、数据结构与算法等基础知识；
2、3年以上Linux环境下常用语言
(C/C++/JAVA/Python)开发经验，熟练使用常用Linux命令；
3、1年以上大规模网页爬虫开发经验，熟悉浏览器原理、前端JS、AJAX；
4、深入了解前端JS反爬，能解决前端动态JS混淆问题；
5、深入了解非逆向、非侵入式手机APP采集方法；
6、熟悉了解容器化编排技(swarm/k8s/mesos)；
7、熟练使用一门以上脚本语言
(Python/Javascript)；
8、熟练使用一种以上的数据库
(Mongodb/HBase/MySQL)；
9、有前后端或大数据项目开发经验优先；
10、有分布式系统设计开发落地经验优先。
其他：
上午09:00 - 下午06:00 双休

————————————————

网易游戏

-10000人以上

-游戏

地址｜广州侨鑫国际

高级爬虫工程师

20-30K

职位详情：
1.负责多平台信息爬取和页面内容的提取分析；
2.研究各种网站、网页、链接的形态，发现它们的特点和规律；
3.解决技术疑难问题，包括反反爬、压力控制等；
4.设计各种策略和算法，提升抓取效果；充分利用带宽资源，避免限制，
5.参与搭建通用爬虫系统。
任职要求：
1.计算机及相关专业，本科以上学历，3年以上工作经验；
2.精通计算机网络，熟练掌握Python，Java,多线程，HTML，JS/CSS等技术，熟悉Scrapy框架或其他的Web scraping framework；
3.精通网页抓取原理及技术，精通正则表达式，能从结构化的和非结构化的数据中获取信息；
4.有丰富的Linux系统使用经验，熟悉MySQL、Redis等，熟悉Internet基本协议（如TCP/IP，HTTP等）；
5.能够解决封账号、封IP采集、验证码识别、图像识别等问题,解决网页抓取、信息抽取等问题,构建完善的网络信息收集平台；
6.有分布式爬虫架构经验者优先；
7.具有文本分析、数据挖掘、自然语言处理、信息检索、机器学习背景者优先；
其他：
上午9:30 - 下午6:00 双休