应届生如何开启AI行业的职业生涯?
©作者|Zhongmei
来源|神州问学
引言
人工智能和数据科学几乎可以在任何产生数据的场合中发挥作用,因为它们开辟了一种全新的范式——让机器能够从数据中提炼出知识。自2011年人工智能走出实验室的门槛,到2016年阿尔法狗在围棋对决中战胜李世石和柯洁,"人工智能"(AI)开始受到广泛的关注。直到2022年尾,以ChatGPT为代表的大规模语言模型再次引发了一轮AI浪潮。人工智能的迅速崛起催生了大量的工作机会,吸引了众多人才蜂拥而至,希望进入这个令人兴奋的领域。如果你也是渴望加入这一行列的应届生,希望本文能为你提供实用的指南和启示。
入门:学习基础知识
事实上,标有AI标签的研究论文数量已经远远超出任何人一生所能阅读的范围。因此,选择学习的主题并确定优先顺序变得至关重要。在机器学习技术的职业生涯中,公认的重要主题包括:
1. 数学基础:关键内容包括微积分(偏微分、链式法则、矩阵求导等),线性代数(向量、张量、矩阵运算、求逆、特征值分解、行列式等),统计与概率(包括离散与连续概率、标准概率分布、独立性与贝叶斯规则、假设检验、最大似然估计(MLE)和最大后验估计(MAP)等)以及优化理论(线性与非线性优化、凸优化/非凸优化及其求解方法如梯度下降、牛顿法等)。此外,探索性数据分析(EDA)也是必备技能,通过可视化和其他方法系统地探索数据集,在分析错误和获得洞见上至关重要。
2. 机器学习技能:理解监督学习和非监督学习至关重要。能够解释传统模型,如线性回归、逻辑回归、神经网络、决策树、聚类和异常检测等也同样重要。除了具体模型之外,理解机器学习的核心概念以及这些东西如何发挥作用也是必不可少的:比如偏差/方差(bias/variance)、成本函数(cost functions)、正则化(regularization)、优化算法(optimization algortithms)和误差分析(error analysis)等等。
3. 深度学习:这一模拟人脑神经元工作模式的技术已成为机器学习的重要组成部分。深入理解神经网络的基础和掌握实践技巧极为关键,如反向传播、梯度下降、序列模型、多层感知机(MLP)、卷积神经网络(CNN)、循环神经网络(RNN)以及变革性的Transformers。同时,掌握高效参数微调(peft)和基于人类反馈的对齐微调策略(RLHF)也至关重要。
4. 软件开发:在机器学习建模技能的基础上,具备一定的软件开发能力会成为加分项。熟悉Python编程、关键库如TensorFlow、PyTorch和scikit-learn;在大模型出现以后,了解如langchain和llamaindex等开发框架也极为重要;同时,掌握与机器学习相关的数据结构、算法(连带与数据库和数据操作相关的算法)和软件设计也不容忽视。
不难发现,要学的东西很多,而且这些领域并不是独立存在的,或多或少都互联关联和互通,所以不要试图把所有相关的数学通学一遍再开始你的学习,而是应该再学习的过程中延展知识结构,毕竟可以在对机器学习的学习中,有针对性的补充基础数学知识。同时,要做好终生学习的心里准备,学习这些成熟技术完全只是基础中的基础,AI这个领域变化之快,跟上不断变化的技术更为重要,想跟上时代,除了学习别无选择。最后,给和我一样减肥喜欢点收藏等于练了的人一点建议:AI学习的开始,不需要收集过多的资料,可以从一个标准课程开始,比如Coursera上面有吴恩达的机器学习课程,就是一个非常好的基础入门。如果你对大语言模型格外感兴趣,也可以看台湾大学李宏毅生成式人工智能教程(https://speech.ee.ntu.edu.tw/~hylee/genai/2024-spring.php),如果你英语很好也对机器学习有基础入门,就可以看OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 整理的一份机器学习论文清单Ilya 30u30(https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE)。The small changes that change everthing. 不用今天就学足30分钟,可以从看3分钟的小段开始。其次,因为AI的迭代性快,所以要注意资料的时效性。超过三年的信息很可能就不再适用了。
入行:积累项目经验
职业生涯的成功往往包括参与众多项目,这些项目应在范围、复杂性和影响力上随着时间的推移逐步增长。因此,最好是从小项目开始。早期项目可以作为学习的平台,随着你技能的提升,逐渐过渡到更大的项目。换句话说,作为初学者,你不能期待别人会轻易地分享好主意或资源,但通过小项目的成功,你可以更容易地获得他人的支持和资源,以承担更大的项目。例如,学生可以参加优质的免费课程并参与Kaggle等实际操作竞赛。如果你已经在职,可以尝试发展一份与你兴趣相关的副业,这不一定要发展成更大的事业,但足以激发你的创造力。吴恩达教授曾分享,当自己还是全职教授的时候,虽然在线教育最初不是他的职责范围,但他早期在家录制教学视频的经历最终成为他深入在线教育领域的垫脚石。硅谷也充满了许多最初作为副业启动的项目,最终发展成成功企业的例子。
为什么项目很重要?
首先,一个项目涵盖众多规划和步骤。一个项目通常从一个商业问题出发(而不是人工智能问题),比如,你想将AI应用在气候环境这个问题上,就会发现电网运营商其实是无法准确预测出风能、太阳能等间歇性能源未来某刻能产生的电量的。深刻了解这个商业问题后,你可以进行头脑风暴,寻找解决方案。比如,你想到使用卫星图像更准确的映射风力涡轮机的高度和位置,以此估计它的发电能力。以及,天气数据可以预测太阳辐射量,用来估计太阳能发电量。随后,你需要评估这些解决方案的可行性和潜在价值,可能包括查阅相关论文、咨询领域专家或进行小型实验以快速验证概念(poc)。一旦认为项目具有足够的价值,下一步就需要设定具体的目标和里程碑。目标其实就是达成的指标,这些目标既包括机器学习指标(比如precision、F1 Score等等),也包括商业指标(如收入等)。里程碑则包括为了完成这个目标需要完成的重要步骤,以及它们的deadline。然后,需要考虑预算,思考完成项目需要的数据、运算资源、时间、外部帮助等等。比如,如果真的购买卫星图像来预测风力发电量,必须确保这在预算范围内。
一个真正的项目就是在这几个步骤里不断迭代的过程,在任何步骤中,你发现当前方向不可行,都可能需要返回到之前的步骤,从一个新视角,用你的新理解继续前进。这中间面临的困难和挑战,就是一个人进步的路径。
如果没有任何项目想法怎么办?
1. 持续阅读&与人交流:多读、多思考,经常与他人交流。当得到的输入多,思考多,就很容易迸发出新的想法。同时,如果你发现别人有一个想法,你可以加入他们,一起完成一个项目,和学校里需要自己组队完成的小组作业一样。
2. 专注一个应用领域:现在很多的研究人员都在试图升级推进某基础AI技术,比如:想要发明下一代transfomers或者怎么继续扩大现有大语言模型的规模,这其实不是一个能马上上手的事情。AI尚未普及的应用领域有很多,神经网络可以用于绝大多数能想到的事上,从广告推荐到自动驾驶等等。如果你的学校或者公司在某个特定领域里,这可能帮助你发现独特的视角和未被开发的潜在机会。
什么样的项目值得去做?
1. 有助于技术成长:一方面,它需要挑战性,需要你通过研究和学习来完成,这样可以提升你的技能;但是另一方面,不可以难到无法达成,就像你不能期待一个没听过决策树的人,过来给你讲解什么是随机森林。所以通过一本好的教材或者课程中循序渐进的安排来一步一步走是个很好的选择。一个优质的项目,它的技术复杂性和/或商业影响应该可以帮助你通向更大项目。
2. 有合适的队友:好的合作者可以让你学到很多,如果可以拥有一个学习小组,就可以一起讨论问题,从周围人身上学习,互补不足。也可以一起研究,共同进步。同时,学会沟通也是关键,解释你的思路,说服你的队友,这些都是进步的途径。
入职:找到合适岗位
寻找工作通常包括几个可预见的步骤:制作(捏造)出合适的简历、选择目标公司、准备面试,并最终选定职位及谈判薪资与福利。在AI行业,这个过程也不例外。首先,了解AI公司中的主要岗位和职责至关重要。作为一个技术驱动的行业,AI公司的技术团队通常包括产品经理、算法工程师、研发和测试等角色。具体来说,产品经理负责把握客户需求和开发方向;算法工程师则设计并开发用于解决特定问题的高效算法,如数据处理、图像识别、自然语言处理、机器学习等领域的算法;研发人员则负责做工程化的输出,将AI能力以产品或服务的形式提供给客户;测试人员则确保产品和服务的质量过关。找到适合自己的方向是最基本的。
在此基础上,思考是否需要在角色或行业上进行转换也很关键。例如,物理学家、软件工程师或大学生转型成为机器学习工程师属于角色转换;从医疗保健、金融服务或政府机构转入软件公司则属于行业转换。同时转换角色和行业的难度通常会更大。对于这种踏入未知的状况,你对目标工作的了解很可能不足,信息性面试就十分重要。信息性面试,虽然称为面试,但是不必在特定公司或岗位的正式面试中进行,而是最好在求职准备阶段,通过访谈某一岗位的从业者,探索他每天日常工作是什么样的,这个角色承担的责任是什么,团队是如何协作的等等。这一步骤尤为重要,因为AI领域中公司对岗位的命名并不统一,确保所申请的职位符合你的期望是关键。
在AI领域寻找工作时,还存在一些特殊的差异。许多公司处于探索阶段,正在确定自己所需的AI相关技能和如何招募具备这些技能的人才。有时,即使你觉得某个岗位名称和描述非常合适,面试官的期待却大相径庭,这时你需要清楚地表达你的潜力和相关经验。
另外,一份优秀的工作机会不仅要符合预期的工作内容、工作环境和薪资,对于AI行业来说,还有两样,一个是teamate,一个是mentor。AI应用的开发通常不是单打独斗,一个生产级的AI应用不可能是一个人完成的,一个善于协作和沟通的团队,就是一份工作加分的地方。因为这不仅能提升工作效率,还有助于建立优质的社交网络或社区,从中你可以随时随地获得所需要的建议和帮助。另一方面,如果工作中你的领导很关注你的个人成长,或者有一个亦师亦友的角色,那就是件十分幸运的事情。但是如果你的工作环境不能提供足够的个人成长支持,加入一个优秀的AI社群或组织,与志同道合的人一起学习和进步,也是一个很好的选择。
尾语
AI是一个极其宽泛的概念,并不仅限于当前最火的大型语言模型(LLM)。事实上,AI行业作为一个广阔的B2B市场,包含了许多客户服务类的前端岗位,如销售、售前、运营、培训和市场营销。例如,销售人员负责识别客户需求并推广AI产品或服务;售前人员则从技术角度支持销售过程和转化;培训人员负责教育客户如何使用AI产品或服务;运营人员处理售后服务和客户关系维护;市场营销人员则致力于扩大品牌的影响力。这些角色都是AI公司或团队成功的关键组成部分。因此,如果你对AI真正感兴趣,可以从学习基础知识开始入门。这种基本的入门不仅让你熟悉AI领域的专业术语,让你看起来不再是门外汉;还能从某种程度上对AI祛魅。进一步地,当你开始学习建模和编程时,你可能会发现进入AI领域的门槛并没有想象中的那么高。事实上,LLM的出现已经大幅降低了自然语言处理领域的入门难度;反之,你也可能发现这并不是你的兴趣所在。在这一过程中,积累项目经验也提供了一个试错的机会。最后如果你完成这些步骤,可以进一步看看AI公司中人们在做什么,看看他们是否都在进行数据标注【手动狗头】。从中,你可以找到一个你认为自己能胜任、有价值、并能视为事业的工作。最终,希望你的职业选择不仅是因为某个领域的热度,而是基于对该领域的真正热情和兴趣。