2024届应届生突破1179万人,如何瞄准AI行业,获得高薪职业前景

图片

应届生如何开启AI行业的职业生涯?

©作者|Zhongmei

来源|神州问学

引言

人工智能和数据科学几乎可以在任何产生数据的场合中发挥作用,因为它们开辟了一种全新的范式——让机器能够从数据中提炼出知识。自2011年人工智能走出实验室的门槛,到2016年阿尔法狗在围棋对决中战胜李世石和柯洁,"人工智能"(AI)开始受到广泛的关注。直到2022年尾,以ChatGPT为代表的大规模语言模型再次引发了一轮AI浪潮。人工智能的迅速崛起催生了大量的工作机会,吸引了众多人才蜂拥而至,希望进入这个令人兴奋的领域。如果你也是渴望加入这一行列的应届生,希望本文能为你提供实用的指南和启示。

图片

入门:学习基础知识

事实上,标有AI标签的研究论文数量已经远远超出任何人一生所能阅读的范围。因此,选择学习的主题并确定优先顺序变得至关重要。在机器学习技术的职业生涯中,公认的重要主题包括:

1.  数学基础:关键内容包括微积分(偏微分、链式法则、矩阵求导等),线性代数(向量、张量、矩阵运算、求逆、特征值分解、行列式等),统计与概率(包括离散与连续概率、标准概率分布、独立性与贝叶斯规则、假设检验、最大似然估计(MLE)和最大后验估计(MAP)等)以及优化理论(线性与非线性优化、凸优化/非凸优化及其求解方法如梯度下降、牛顿法等)。此外,探索性数据分析(EDA)也是必备技能,通过可视化和其他方法系统地探索数据集,在分析错误和获得洞见上至关重要。

2.  机器学习技能:理解监督学习和非监督学习至关重要。能够解释传统模型,如线性回归、逻辑回归、神经网络、决策树、聚类和异常检测等也同样重要。除了具体模型之外,理解机器学习的核心概念以及这些东西如何发挥作用也是必不可少的:比如偏差/方差(bias/variance)、成本函数(cost functions)、正则化(regularization)、优化算法(optimization algortithms)和误差分析(error analysis)等等。

3.  深度学习:这一模拟人脑神经元工作模式的技术已成为机器学习的重要组成部分。深入理解神经网络的基础和掌握实践技巧极为关键,如反向传播、梯度下降、序列模型、多层感知机(MLP)、卷积神经网络(CNN)、循环神经网络(RNN)以及变革性的Transformers。同时,掌握高效参数微调(peft)和基于人类反馈的对齐微调策略(RLHF)也至关重要。

4.  软件开发:在机器学习建模技能的基础上,具备一定的软件开发能力会成为加分项。熟悉Python编程、关键库如TensorFlow、PyTorch和scikit-learn;在大模型出现以后,了解如langchain和llamaindex等开发框架也极为重要;同时,掌握与机器学习相关的数据结构、算法(连带与数据库和数据操作相关的算法)和软件设计也不容忽视。

不难发现,要学的东西很多,而且这些领域并不是独立存在的,或多或少都互联关联和互通,所以不要试图把所有相关的数学通学一遍再开始你的学习,而是应该再学习的过程中延展知识结构,毕竟可以在对机器学习的学习中,有针对性的补充基础数学知识。同时,要做好终生学习的心里准备,学习这些成熟技术完全只是基础中的基础,AI这个领域变化之快,跟上不断变化的技术更为重要,想跟上时代,除了学习别无选择。最后,给和我一样减肥喜欢点收藏等于练了的人一点建议:AI学习的开始,不需要收集过多的资料,可以从一个标准课程开始,比如Coursera上面有吴恩达的机器学习课程,就是一个非常好的基础入门。如果你对大语言模型格外感兴趣,也可以看台湾大学李宏毅生成式人工智能教程(https://speech.ee.ntu.edu.tw/~hylee/genai/2024-spring.php),如果你英语很好也对机器学习有基础入门,就可以看OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 整理的一份机器学习论文清单Ilya 30u30(https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE)。The small changes that change everthing. 不用今天就学足30分钟,可以从看3分钟的小段开始。其次,因为AI的迭代性快,所以要注意资料的时效性。超过三年的信息很可能就不再适用了。

图片

入行:积累项目经验

职业生涯的成功往往包括参与众多项目,这些项目应在范围、复杂性和影响力上随着时间的推移逐步增长。因此,最好是从小项目开始。早期项目可以作为学习的平台,随着你技能的提升,逐渐过渡到更大的项目。换句话说,作为初学者,你不能期待别人会轻易地分享好主意或资源,但通过小项目的成功,你可以更容易地获得他人的支持和资源,以承担更大的项目。例如,学生可以参加优质的免费课程并参与Kaggle等实际操作竞赛。如果你已经在职,可以尝试发展一份与你兴趣相关的副业,这不一定要发展成更大的事业,但足以激发你的创造力。吴恩达教授曾分享,当自己还是全职教授的时候,虽然在线教育最初不是他的职责范围,但他早期在家录制教学视频的经历最终成为他深入在线教育领域的垫脚石。硅谷也充满了许多最初作为副业启动的项目,最终发展成成功企业的例子。

图片

为什么项目很重要?

首先,一个项目涵盖众多规划和步骤。一个项目通常从一个商业问题出发(而不是人工智能问题),比如,你想将AI应用在气候环境这个问题上,就会发现电网运营商其实是无法准确预测出风能、太阳能等间歇性能源未来某刻能产生的电量的。深刻了解这个商业问题后,你可以进行头脑风暴,寻找解决方案。比如,你想到使用卫星图像更准确的映射风力涡轮机的高度和位置,以此估计它的发电能力。以及,天气数据可以预测太阳辐射量,用来估计太阳能发电量。随后,你需要评估这些解决方案的可行性和潜在价值,可能包括查阅相关论文、咨询领域专家或进行小型实验以快速验证概念(poc)。一旦认为项目具有足够的价值,下一步就需要设定具体的目标和里程碑。目标其实就是达成的指标,这些目标既包括机器学习指标(比如precision、F1 Score等等),也包括商业指标(如收入等)。里程碑则包括为了完成这个目标需要完成的重要步骤,以及它们的deadline。然后,需要考虑预算,思考完成项目需要的数据、运算资源、时间、外部帮助等等。比如,如果真的购买卫星图像来预测风力发电量,必须确保这在预算范围内。

一个真正的项目就是在这几个步骤里不断迭代的过程,在任何步骤中,你发现当前方向不可行,都可能需要返回到之前的步骤,从一个新视角,用你的新理解继续前进。这中间面临的困难和挑战,就是一个人进步的路径。

如果没有任何项目想法怎么办?

1.  持续阅读&与人交流:多读、多思考,经常与他人交流。当得到的输入多,思考多,就很容易迸发出新的想法。同时,如果你发现别人有一个想法,你可以加入他们,一起完成一个项目,和学校里需要自己组队完成的小组作业一样。

2.  专注一个应用领域:现在很多的研究人员都在试图升级推进某基础AI技术,比如:想要发明下一代transfomers或者怎么继续扩大现有大语言模型的规模,这其实不是一个能马上上手的事情。AI尚未普及的应用领域有很多,神经网络可以用于绝大多数能想到的事上,从广告推荐到自动驾驶等等。如果你的学校或者公司在某个特定领域里,这可能帮助你发现独特的视角和未被开发的潜在机会。

什么样的项目值得去做?

1.  有助于技术成长:一方面,它需要挑战性,需要你通过研究和学习来完成,这样可以提升你的技能;但是另一方面,不可以难到无法达成,就像你不能期待一个没听过决策树的人,过来给你讲解什么是随机森林。所以通过一本好的教材或者课程中循序渐进的安排来一步一步走是个很好的选择。一个优质的项目,它的技术复杂性和/或商业影响应该可以帮助你通向更大项目。

2.  有合适的队友:好的合作者可以让你学到很多,如果可以拥有一个学习小组,就可以一起讨论问题,从周围人身上学习,互补不足。也可以一起研究,共同进步。同时,学会沟通也是关键,解释你的思路,说服你的队友,这些都是进步的途径。

图片

入职:找到合适岗位

寻找工作通常包括几个可预见的步骤:制作(捏造)出合适的简历、选择目标公司、准备面试,并最终选定职位及谈判薪资与福利。在AI行业,这个过程也不例外。首先,了解AI公司中的主要岗位和职责至关重要。作为一个技术驱动的行业,AI公司的技术团队通常包括产品经理、算法工程师、研发和测试等角色。具体来说,产品经理负责把握客户需求和开发方向;算法工程师则设计并开发用于解决特定问题的高效算法,如数据处理、图像识别、自然语言处理、机器学习等领域的算法;研发人员则负责做工程化的输出,将AI能力以产品或服务的形式提供给客户;测试人员则确保产品和服务的质量过关。找到适合自己的方向是最基本的。

在此基础上,思考是否需要在角色或行业上进行转换也很关键。例如,物理学家、软件工程师或大学生转型成为机器学习工程师属于角色转换;从医疗保健、金融服务或政府机构转入软件公司则属于行业转换。同时转换角色和行业的难度通常会更大。对于这种踏入未知的状况,你对目标工作的了解很可能不足,信息性面试就十分重要。信息性面试,虽然称为面试,但是不必在特定公司或岗位的正式面试中进行,而是最好在求职准备阶段,通过访谈某一岗位的从业者,探索他每天日常工作是什么样的,这个角色承担的责任是什么,团队是如何协作的等等。这一步骤尤为重要,因为AI领域中公司对岗位的命名并不统一,确保所申请的职位符合你的期望是关键。

在AI领域寻找工作时,还存在一些特殊的差异。许多公司处于探索阶段,正在确定自己所需的AI相关技能和如何招募具备这些技能的人才。有时,即使你觉得某个岗位名称和描述非常合适,面试官的期待却大相径庭,这时你需要清楚地表达你的潜力和相关经验。

图片

另外,一份优秀的工作机会不仅要符合预期的工作内容、工作环境和薪资,对于AI行业来说,还有两样,一个是teamate,一个是mentor。AI应用的开发通常不是单打独斗,一个生产级的AI应用不可能是一个人完成的,一个善于协作和沟通的团队,就是一份工作加分的地方。因为这不仅能提升工作效率,还有助于建立优质的社交网络或社区,从中你可以随时随地获得所需要的建议和帮助。另一方面,如果工作中你的领导很关注你的个人成长,或者有一个亦师亦友的角色,那就是件十分幸运的事情。但是如果你的工作环境不能提供足够的个人成长支持,加入一个优秀的AI社群或组织,与志同道合的人一起学习和进步,也是一个很好的选择。

尾语

AI是一个极其宽泛的概念,并不仅限于当前最火的大型语言模型(LLM)。事实上,AI行业作为一个广阔的B2B市场,包含了许多客户服务类的前端岗位,如销售、售前、运营、培训和市场营销。例如,销售人员负责识别客户需求并推广AI产品或服务;售前人员则从技术角度支持销售过程和转化;培训人员负责教育客户如何使用AI产品或服务;运营人员处理售后服务和客户关系维护;市场营销人员则致力于扩大品牌的影响力。这些角色都是AI公司或团队成功的关键组成部分。因此,如果你对AI真正感兴趣,可以从学习基础知识开始入门。这种基本的入门不仅让你熟悉AI领域的专业术语,让你看起来不再是门外汉;还能从某种程度上对AI祛魅。进一步地,当你开始学习建模和编程时,你可能会发现进入AI领域的门槛并没有想象中的那么高。事实上,LLM的出现已经大幅降低了自然语言处理领域的入门难度;反之,你也可能发现这并不是你的兴趣所在。在这一过程中,积累项目经验也提供了一个试错的机会。最后如果你完成这些步骤,可以进一步看看AI公司中人们在做什么,看看他们是否都在进行数据标注【手动狗头】。从中,你可以找到一个你认为自己能胜任、有价值、并能视为事业的工作。最终,希望你的职业选择不仅是因为某个领域的热度,而是基于对该领域的真正热情和兴趣。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/359321.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

tedsign vue3 web-端框架中封装一个验证码组件 以及对应node 接口逻辑说明

一个这样的组件 我直接上代码了 <template><t-loading size"small" :loading"loading" show-overlay><div class"container" click"refresh"><div v-if"svg" class"svg" v-html"svg&…

数据驱动制造:EMQX ECP 指标监测功能增强生产透明度

迈向未来的工业生产&#xff0c;需要的不仅是自动化&#xff0c;更是智能化。如果工业企业的管理者能够实时监测每一生产环节的设备运行状态&#xff0c;每一数据点位情况&#xff0c;洞察和优化每一步生产流程&#xff0c;他们将能够做出更精准的决策&#xff0c;提高生产效率…

支付互通新进展:微信收款码全场景接入银联网络

随着支付便利化工作的不断推进&#xff0c;条码支付互联互通已经成为行业发展的重要趋势。 近日&#xff0c;银联网络迎来微信支付收款码场景的全面接入。 这一举措推动条码支付互联互通取得新进展&#xff0c;为境内外广大消费者提供更多支付选择、更好支付体验。无论从行业…

已经被驳回的商标名称还可以申请不!

看到有网友在问&#xff0c;已经驳回的商标名称还可以申请不&#xff0c;普推商标知产老杨觉得要分析看情况&#xff0c;可以适当分析下看可不可以能申请&#xff0c;当然最终还是为了下证 &#xff0c;下证概率低的不建议申请。 先看驳回理由&#xff0c;如果商标驳回是绝对理…

代码随想录day32

一旦有重叠区域&#xff0c;则用min更新右边界 class Solution(object):def findMinArrowShots(self, points):""":type points: List[List[int]]:rtype: int"""points.sort(keylambda x:x[0])if len(points)0:return 0count 1for i in range(…

gitlab仓库中用git bash生成不是默认路径的ssh秘钥

使用命令 ssh-keygen -t rsa -b 4096 -C "your_emailexample.com" 会在默认路径生成秘钥&#xff0c;&#xff08;C:\Users\用户\.ssh\&#xff09; 想要修改默认路径使用如下命令&#xff1a; ssh-keygen -t rsa -b 4096 -C "your_emailexample.com"…

nginx负载均衡案例,缓存知识----补充

负载均衡案例 ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MariaDB server version for the right syntax to use near great all on wordpress.* to wp172.16.1.% indentified by 1 at line 1 MariaDB [(none)]>…

openstack-同一物理机中透传不同GPU时的nova配置记录

文章目录 前言一、不同加速卡的型号信息二、计算节点增加配置信息1.nova-compute服务的nova.conf 三、控制节点增加配置信息1.nova-conductor服务的nova.conf2.nova-scheduler服务的nova.conf3.nova-api服务的nova.conf 四、准备实例模版五、进行测试&#xff0c;创建虚拟机、检…

【操作系统】多进程拷贝|进程重载

&#x1f525; 博客主页&#xff1a; 我要成为C领域大神&#x1f3a5;系列专栏&#xff1a;【C核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞&#x1f44d;收藏⭐评论✍️ 本博客致力于分享知识&#xff0c;欢迎大家共同学习和交流。 ​ 为什么要进行…

FEP分液漏斗Teflon耐酸碱四氟耐腐蚀耐高温250ml

FEP分液漏斗&#xff1a;也叫特氟龙分液漏斗、特氟龙梨型分液漏斗等。广泛应用于痕量分析、超痕量分析、ICP-MS分析、同位素分析等实验。 规格参考&#xff1a;125ml、250ml、500ml、1000ml 其主要特性有&#xff1a; 1.内壁对溶剂无粘贴性和吸附&#xff0c;可完全排空&…

Springboot 权限认证框架 -- SA-Token 简介(一)

引言 现今的软件开发中&#xff0c;权限认证与访问控制是每一个应用都必不可少的功能。SA-Token是一个简单、安全、易用的权限认证框架&#xff0c;它主要解决登录认证、权限认证、Session会话、单点登录等功能。SA-Token以其轻量级、零学习成本的特点&#xff0c;迅速赢得了开…

无重复字符串的排列组合

题目链接 无重复字符串的排列组合 题目描述 注意点 字符都是英文字母字符串长度在[1, 9]之间字符串每个字符均不相同 解答思路 字符串中有n个字符&#xff0c;则其排列组合的数量为n * (n - 1) * (n - 2) * … * 1可以深度优先遍历找到字符串的所有排列组合&#xff0c;且…

用Java获取键盘输入数的个十百位数

这段Java代码是一个简单的程序&#xff0c;用于接收用户输入的一个三位数&#xff0c;并将其分解为个位、十位和百位数字&#xff0c;然后分别打印出来。下面是代码的详细解释&#xff1a; 导入所需类库: import java.util.Scanner;&#xff1a;导入Scanner类&#xff0c;用于从…

【源码+文档+调试讲解】牙科就诊管理系统

摘 要 现代经济快节奏发展以及不断完善升级的信息化技术&#xff0c;让传统数据信息的管理升级为软件存储&#xff0c;归纳&#xff0c;集中处理数据信息的管理方式。本牙科就诊管理系统就是在这样的大环境下诞生&#xff0c;其可以帮助管理者在短时间内处理完毕庞大的数据信息…

网络编程(七)网络超时检测

文章目录 一、概念二、实现方式&#xff08;一&#xff09; 使用select实现超时检测1. select函数补充说明&#xff1a;2. 使用示例3. 输出结果 &#xff08;二&#xff09; 使用setsockopt函数1. 函数定义2. 获取发送缓冲区和接收缓冲区的大小3. 端口复用4. 设置超时时间 &…

【C++】文件处理(IO流)

文章目录 C IO流1. C语言IO2. CIO2.1 C标准IO流2.2 C文件IO流2.3 C IO 文件常用函数总结表2.4 C stringstream C IO流 回顾一下&#xff0c;C语言中IO输入输出的 1. C语言IO C语言中常用的输入输出函数有如下几种&#xff1a;前者是格式化标准输入输出&#xff0c;后者是格式化…

探秘分布式一致性(共识)算法 :Raft

1.前言 Raft 算法是 Multi-Paxos 算法的一种&#xff0c;是一种强一致性算法。核心就是通过日志复制的方式达到整个集群的副本一致。 Raft 算法的三个核心概念就是 Leader 的选举、日志复制、节点变更。本文也将从这三个方面进行探讨。之后再聊聊 Raft 算法的几个应用场景。 2.…

动手学深度学习(Pytorch版)代码实践 -卷积神经网络-27含并行连结的网络GoogLeNet

27含并行连结的网络GoogLeNet import torch from torch import nn from torch.nn import functional as F import liliPytorch as lp import matplotlib.pyplot as pltclass Inception(nn.Module):# c1--c4是每条路径的输出通道数def __init__(self, in_channels, c1, c2, c3, …

免费内网穿透工具 ,快解析内网穿透解决方案

在IPv4公网IP严重不足的环境下&#xff0c;内网穿透技术越来越多的被人们所使用&#xff0c;使用内网穿透技术的好处有很多。 1&#xff1a;无需公网ip 物以稀为贵&#xff0c;由于可用的公网IP地址越来越少&#xff0c;价格也是水涨船高&#xff0c;一个固定公网IP一年的成本…

C++ 矩阵的最小路径和解法

描述 给定一个 n * m 的矩阵 a,从左上角开始每次只能向右或者向下走,最后到达右下角的位置,路径上所有的数字累加起来就是路径和,输出所有的路径中最小的路径和。 数据范围: 1≤𝑛,𝑚≤5001≤n,m≤500,矩阵中任意值都满足 0≤𝑎𝑖,𝑗≤1000≤ai,j​≤100 要求…