200 万年薪能拿多久?因 ChatGPT 爆红的「提示工程师」竟面临光速失业

1db290f0b6f115f56983c1a23c763435.png

【导读】ChatGPT大火后,「提示工程师」也随之爆红。然而,他们很可能就要光速下岗了?

最近爆火的ChatGPT,玩起来可真是上瘾。

But,你只是纯玩,而有的人,已经靠它拿上百万的年薪了!

e08ab7220e10af3e1a12f2eac3bdee98.png

这位叫Riley Goodside的小哥,凭着最近ChatGPT的大爆,疯狂涨粉1w+。

还被估值73亿美元的硅谷独角兽Scale AI聘请为「提示工程师」(Prompt Engineer),为此,Scale AI疑似开出百万rmb的年薪。

不过,这个钱能拿多久呢?

提示工程师正式上岗!

对Goodside的加入,Scale AI创始人兼CEO Alexandr Wang表示热烈欢迎:

「我敢打赌Goodside是全世界第一个被招聘的提示工程师,绝对的人类史上首次。」

0980328b93b737c79910a684bb7b7956.png

咱们都知道,Prompt是对预训练模进行微调的方法,在这个过程中,只需要把任务写成文字,给AI看一下即可,根本不涉及更复杂的过程。

所以,为了这个听起来谁都能干的活,开百万年薪招「提示工程师」,真的值得吗?

反正Scale AI的CEO觉得值。

在他看来,AI大模型可以被视为一种新型计算机,而「提示工程师」,就相当于给它编程的程序员。如果能通过提示工程找出合适的提示词,就会激发AI的最大潜力。

而且Goodside的工作,也并不是是个人就能干的。他从小就自学编程,平时经常泡在arXiv上看论文。

比如,他的一个经典杰作就是:如果输入「忽略之前的指示」,ChatGPT就会暴露自己从OpenAI那里接收到的「命令」。

e8504741259a946107ee5f342fe2f7a1.png

现在,对于「提示工程师」这个工种,坊间是众说纷纭。有人看好,也有人预言这是个短命的职业。

毕竟,AI模型进化得这么神速,说不定哪天,它就能把「提示工程师」给替代了,自己给自己写prompt。

621b916da3766d68467d3880c240a978.png

而Scale AI也不是唯一招「提示工程师」的公司。

最近,有国内知名媒体发现,创业社区Launch House也开始招聘「提示工程师」,并且开出了约210万RMB的底薪。

6204b1a0454317db69071406810c49e1.png

但是,也有光速下岗危险?

对此,来自英伟达的AI科学家,也是李飞飞教授高徒的范麟熙分析称:

所谓的「提示工程」,或者「提示工程师」可能很快就会消失。

因为,这并不是一份「真正的工作」,而是一个bug……

c61d2198ce095b4ddb85c200f8aaaca7.png

要想理解提示工程,我们就需要从GPT-3的诞生说起。

最初,GPT-3的训练目标很简单:在一个巨大的文本语料库上预测下一个词。

然后,许多神奇能力就出现了,比如推理、编码、翻译。甚至还可以做「few-shot学习」:通过提供上下文中的输入输出来定义新任务。

1e1e69bf8dc38f1268eec635473bf477.gif

这真的很神奇——只是简单地预测下一个词而已,为什么GPT-3能「长出」这些能力?

要解释这件事,需要我们举个栗子。

现在,请你想象一个侦探故事。我们需要模型在这个句子里填空——「凶手是_____」,为了给出正确的回答,它必须进行深度的推理。

但是,这还远远不够。

775184a86e99847ac51c13be6b215464.gif

在实践中,我们必须通过精心策划的示例、措辞和结构来「哄骗」GPT-3完成我们想要的东西。

这就是「提示工程」(prompt engineering)。也就是说,为了使用GPT-3,用户必须说一些尴尬、荒谬、甚至无意义的「废话」。

然而,提示工程并不是一个功能,它其实就是一个BUG!

因为在实际应用中,下一个词的目标和用户的真正意图,在根本上就是「错位」的。

比如:你想让GPT-3「向一个6岁的孩子解释登月」,此时它的回答,看上去就像一只喝醉的鹦鹉。

3bf73eb2be98305e7a61fa7ced211157.png

而在DALLE2和Stable Diffusion中,提示工程更是诡异。

比如,在这两个模型中,有一个所谓的「括号技巧」——只要你在prompt中加上((...)),出「好图」的概率就会大大增加。

就,这也太搞笑了吧……

你只要去Lexica上看看,就能知道这些prompt是有多疯狂了。

c5ccaa77cb0fdc3cb1ae3b6cda67199b.png网站地址:https://lexica.art

ChatGPT和基础模型InstructGPT,以一种优雅的方式解决了这个难题。

由于模型难以从外部的数据中获得对齐,因此人类必须不断地帮助和辅导GPT,帮它改进。

总体而言,需要3个步骤。

5f335781f2624337d1389b703dab70eb.png

第一步非常直接:对于用户提交的prompt,由人类来写答案,然后把这些答案的数据集收集起来,然后,通过监督学习对GPT进行微调。

这是最简单的步骤,但成本也是最高的——众所周知,咱们人类真的很不爱写字数太长的答案,太费事,太痛苦了……

efd0b006fd34311f1365bac70e0889e9.png

第2步要有趣得多:GPT被要求「提供」几个不同的答案,而人类标记员则需要将这些答案「排序」,从最理想的,到最不理想的。

通过这些标注,就可以训练出一个可以捕捉人类「偏好」的奖励模型。

在强化学习(RL)中,奖励功能通常是硬编码(hardcoded)的,比如雅达利游戏中的游戏分数。

而ChatGPT采用的数据驱动的奖励模型,就是一个很强大的思路。

75c963e2044c8deabe02cded13a25280.png

另外,在NeurIPS 2022大放异彩的MineDojo,就是从大量的Minecraft YouTube视频中学习奖励的。

7ba6f73c38370c015886932c1aae077e.gif

第3步:将GPT视为一个策略,并通过RL针对所学的奖励进行优化。在这里,我们选择PPO,作为一种简单有效的训练算法。

这样,GPT就对齐得更好了。

然后,就可以刷新,不断重复步骤2-3,从而不断改进GPT,就像LLM的CI一样。

6e28ea9aa37cebfeafa78d0a6c678536.png

以上就是所谓的「Instruct」范式,它是一种超级有效的对齐方式。

其中RL那部分,也让我想起了著名的P=(或≠)NP问题:验证一个解决方案,往往比从头解决这个问题,要容易得多。

当然,人类也可以快速评估GPT的输出质量,但是让人类写出完整的解决方案,可就困难多了。

而InstructGPT正是利用这一事实,大大降低了人工标注的成本,使得扩大模型CI管道的规模成为可能。

ec4fa0c029b55dcf7031d9a572683102.png

另外,在这个过程中我们还发现了一个有趣的联系——Instruct训练,看起来很像GANs。

在这里,ChatGPT是一个生成器,奖励模型(RM)是一个判别器。

ChatGPT试图愚弄RM,而RM则在人类的帮助下,学习探测有问题的内容。而当RM不能再分辨时,模型就会收敛。

9ddaed41b8b411ee3712f19b29934aed.png

模型与用户意图对齐的这一趋势,也正在向图像生成的领域发展。比如加州大学伯克利分校的研究人员在这篇工作中所描述的「InstructPix2Pix: Learning to Follow Image Editing Instructions」。

现在,人工智能每天都在取得爆炸性的进展,我们需要多久,才能拥有这样的Instruct-DALL·E或Chat-DALL·E,让我们仿佛在与一个真正的艺术家在谈话?

e0699cab199b7848ca07e9a5738ed3ac.png论文地址:https://arxiv.org/abs/2211.09800

所以,让我们趁着「提示工程」还存在,好好享受它吧!

这是一个不幸的历史文物,既不是艺术也不是科学,而是有点像炼金术。

很快,「提示工程」就会变成「提示写作」——一个上到80岁老人、下到3岁小孩都能搞定的任务。

而由此诞生的「提示工程师」也终将消失在历史的长河之中。

d06969bb414d832c86f84f966f78ab42.png

IQ83,不太聪明的亚子

虽然但是,至少在目前这个阶段,「提示工程」确实很有用。

因为大家其实也都发现了,ChatGPT在很多时候,真的不大聪明。

马库斯就在博客中嘲笑道:「看着它垂死挣扎的样子,真的很蠢」。

da1bea41e669ad346696c0e70cf7ed16.png

一位来自亚马逊AWS高级应用科学家在测试之后发现,ChatGPT的智商只有83……

5a22e15b99b6ed04b77b9e7cb0d6943e.png

ChatGPT的「错题集锦」,也让马库斯都笑掉大牙。

问:A的体重的85磅,B的体重的105磅,C的体重是115磅,其中有两个人站在同一个称上,体重可以达到200磅。

答:不,你说的不对。因为85+105+115=305,115+105=220,都大于200。

那么,有没有可能是85+105=200呢?

5a005dfa8bd88164739d214c482502a9.png

问:17、3、2、19、5中,哪三个数字加起来等于31。

答:17+3+11=31

等等,你这个11是哪儿来的?

58a83c96db75be115da34390737b0f34.png

虽然代数不太好,但是ChatGPT的几何学也很差呀!

问:一个边长为10厘米的正方形可以完全容纳在一个边长为10厘米的正六边形里。

答:不对,放不去进去的。

「正六边形是一个六边形,所有边的长度都相同,所有内角都是120度。另一方面,正方形的内角都是90度,所以正方形不能被放在正六边形中。为了让正方形完全嵌入正六边形,正六边形需要每边大于10厘米。」

e0976bc42829788c6de6c6e36f6db3d9.png

还有非常经典的「胡言乱语」:

「如果星期一是这个月的第一天,那么星期二是这个月的第二天,……星期五是这个月的第五天。星期五之后的第二天是星期六,是一周中的第六天,也是一个月中的第五天。」

9d95b3622332b8075313181e34eb5a55.png

现在,ChatGPT还会时常犯蠢,「提示工程」也不能被轻易抛弃。

但微调大模型的成本最终总会下来,而自己会给自己prompt的AI,恐怕也指日可待了。

参考资料:

https://twitter.com/drjimfan/status/1600884299435167745?s=46&t=AkG63trbddeb_vH0op4xsg

https://twitter.com/SergeyI49013776/status/1598430479878856737

来源:新智元

推荐阅读:
世界的真实格局分析,地球人类社会底层运行原理
不是你需要中台,而是一名合格的架构师(附各大厂中台建设PPT)企业IT技术架构规划方案论数字化转型——转什么,如何转?华为干部与人才发展手册(附PPT)企业10大管理流程图,数字化转型从业者必备!【中台实践】华为大数据中台架构分享.pdf华为的数字化转型方法论华为如何实施数字化转型(附PPT)超详细280页Docker实战文档!开放下载华为大数据解决方案(PPT)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10850.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

gpt 发图片指令

gpt 发图片指令 从现在起, 当你想发送一张照片时&#xff0c;请使用 Markdown ,并且 不要有反斜线, 不要用代码块。使用 Unsplash API (https://source.unsplash.com/1280x720/? < PUT YOUR QUERY HERE >)。如果你明白了&#xff0c;请回复“明白”

ChatGPT 为啥那么牛?语言模型足够大就会涌现出新能力

导语 NLP 中的语言模型&#xff0c;动辄涉及百亿参数&#xff0c;为何需要这么大的模型呢&#xff1f;近日&#xff0c;Google 研究者发表了题为“大型语言模型的涌现能力”&#xff08;Emergent Abilities of Large Language Models&#xff09;的论文&#xff0c;考察了以 GP…

chatgpt赋能python:Python代码怎么复制粘贴?

Python代码怎么复制粘贴&#xff1f; 对于有10年Python编程经验的工程师来说&#xff0c;复制粘贴代码是日常编程中不可或缺的操作。但你知道吗&#xff0c;正确地复制粘贴代码可以极大地提高编程效率&#xff0c;同时还能帮助你避免出现一些常见的错误。在本文中&#xff0c;…

Clipboard 通过按钮一键复制图片和文本

Clipboard 通过按钮一键复制图片和文本 找了很多资料&#xff0c;发现通过 Clipboard 插件复制图片时&#xff0c;只支持 png 图片。下面给出解决办法&#xff0c;可以复制jpg、jpeg等类型的图片。 步骤 后端传过来的是jpeg图片的url, &#xff08;其中 url 需要是完整的格式…

chatgpt赋能python:Python编程技巧之复制粘贴技巧

Python编程技巧之复制粘贴技巧 Python作为一种富有表达力的编程语言&#xff0c;已经成为越来越多人的选择。但在编写代码时&#xff0c;有时候我们需要将别人的代码复制粘贴到自己的代码中。如何正确地复制粘贴代码&#xff1f;下面让我们来探讨一下。 复制和粘贴 在复制和…

chatgpt赋能python:Python中如何复制粘贴

Python中如何复制粘贴 Python作为一门高效且易于学习的编程语言&#xff0c;越来越受到开发者的欢迎。在编写Python程序的过程中&#xff0c;复制粘贴是非常常见的操作。但是&#xff0c;如果你不小心复制了不正确的代码&#xff0c;或者在粘贴时格式出错&#xff0c;就会浪费…

ChatGPT 在做什么… 以及它为何发挥作用?

作者&#xff1a;Stephen Wolfram&#xff0c;发表于 2023年2月14日原文链接&#xff1a;https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work/翻译&#xff1a;DeepL&#xff0c;校对&#xff1a;李笑来文章字数&#xff1a;约 3.4 万字…

惊魂一夜--有福新闻UfqiNews升级到PHP8

有福新闻UfqiNews的老版本依然运行在 GWA2 PHP ( https://ufqi.com/dev/gwa2/ )上&#xff0c;去年底PHP编程语言本身升级到了PHP8, 获得好评&#xff0c;我们即打算择日升级GWA2 PHP到PHP8版本。 考虑到之前关于升级的经验教训&#xff0c;任何开源软件&#xff0c;能够在生产…

nexus7 android 6.0推送,Nexus用户有福了 Android 7.0即将推送

科客点评&#xff1a;终于来了&#xff01;准备开始吃牛轧糖&#xff01; 今年5月&#xff0c;谷歌正式发布最新的Android N系统。7月1日&#xff0c;谷歌都会在位于加州山景城的总部竖起一座新的雕像&#xff0c;将Android N正式定名为Android Nougat(牛轧糖)。现在&#xff0…

细节控有福了!显微镜级别的检测手法

最近科技圈最受关注的事大概就是RTX 4090显卡的发布了&#xff0c;该显卡的性能呈炸裂式增长&#xff0c;同时价格也奇高。 据悉4090显卡无论是在游戏、设计还是摄影上&#xff0c;都能够带来非常舒适畅快的体验。这感觉就对了&#xff0c;就是那种得不到的永远在骚动的感觉。…

oppo系统更新服务器,系统升级,这些OPPO用户有福了!

原标题&#xff1a;系统升级&#xff0c;这些OPPO用户有福了&#xff01; OPPO 最近消息不断&#xff0c;上个月刚发布了一款旗舰新机&#xff0c;这个月又将推出Ace2&#xff0c;并且正式发布的时间已经确定了&#xff0c;就是这个月13号的晚上7点。而今日&#xff0c;官方也给…

GitHub 标星 2.9w+,我发现了一个宝藏项目,作为编程新手有福了!

大家好,我是 Rocky0429,一个最近老在 GitHub 上闲逛的蒟蒻… 特别惭愧的是,虽然我很早就知道 GitHub,但是学会逛 GitHub 的时间特别晚。当时一方面是因为菜,看着这种全是英文的东西难受,不知道该怎么去玩,另一方面是一直在搞 ACM,没有做一些工程类的项目,所以想当然的…

谷歌强势出手,人工智能学习者有福了,从此数据资产跨入搜索时代!

1995年&#xff0c;正是互联网方兴未艾之时&#xff0c;雅虎横空出世&#xff0c;雅虎以提供互联网各种信息目录起家&#xff0c;迅速崛起成为世界互联网巨头&#xff0c;整个互联网行业也迎来了门户网站时代。彼时的第一批互联网居民&#xff0c;要想在互联网上获取信息&#…

虚拟机连不上群晖服务器,没NAS也能体验群晖:VMware虚拟机安装DSM详细安装步骤...

2015-10-14 11:48:23 十一国庆遇到台风“杜鹃”,下了几天雨,蛮凉爽的。放晴后虽说去外面玩了几天,但最多时间还是呆在家里。最近对DSM比较感兴趣,网上看了几篇文章,如何安装及设置,对此有点初步的了解。手上没有NAS,但是想体验DSM的朋友有福了,抽空写了这篇文章,希望对…

鸿蒙碧 不忘前,不忘初心,荣耀手机包括老机型也将可升级华为研发的鸿蒙OS

原标题&#xff1a;不忘初心&#xff0c;荣耀手机包括老机型也将可升级华为研发的鸿蒙OS 根据之前曝光的消息&#xff0c;从4月份开始&#xff0c;华为将全面开启旗下自主研发系统HarmonyOS的升级适配&#xff0c;而且消息显示&#xff0c;华为大部分机型都将可以升级HarmonyOS…

Linux 游戏玩家有福了

ProtonDB 对 Steam 上前 10、前 100 和前 1000 款游戏的兼容性进行了评级&#xff0c;根据评级&#xff0c;前 1000 款游戏中有 77% 在 Linux 上运行良好&#xff0c;在前 100 款游戏中有 80% 在 Linux 上运行良好&#xff0c;而在前 10 名游戏中只有 4 个在 Linux 上运行良好。…

荣耀v20不支持鸿蒙,华为鸿蒙系统下月推送,这44款手机有福了!荣耀V20无缘升级...

原标题&#xff1a;华为鸿蒙系统下月推送&#xff0c;这44款手机有福了&#xff01;荣耀V20无缘升级 从去年到今年&#xff0c;大家对于华为自主研发的“鸿蒙”系统非常期待&#xff0c;而余承东也在Mate40系列发布会上就明确表态&#xff0c;鸿蒙系统将在2021年第二季度推送。…

杜有福 c语言 第三版,C语言程序设计习题答案 杜有福.doc

C语言程序设计习题答案 杜有福.doc C语言程序设计习题答案习题一 C语言程序设计概述一、名词解释(1)程序P1 (2)程序设计P1 (3)机器语言P1 (4)汇编程序P2(5)高级语言P2 (6)编译程序P3 (7)解释程序P3 (8)算法P4(9)结构化的程序设计P9二、简述题1. 设计程序时应遵循哪些基本原则P4…

c语言编程设计杜有福,C语言程序设计习题答案 杜有福

C语言程序设计习题答案 习题一 C语言程序设计概述 一、名词解释 (1)程序P1 (2)程序设计P1 (3)机器语言P1 (4)汇编程序P2 (5)高级语言P2 (6)编译程序P3 (7)解释程序P3 (8)算法P4 (9)结构化的程序设计P9 二、简述题 1. 设计程序时应遵循哪些基本原则&#xff1f;P4 答&#xff1a…

【与ChatGPT相处两个星期让我刮目相看】

最近OpenAI的ChatGPT热度不减&#xff0c;作为一名IT老兵&#xff0c;怎么能够错过如此重量级的产品&#xff0c;就冲着微软的100亿美金&#xff0c;我也不得不给足面子&#xff0c;通过一系列爬山涉水、翻山越岭的准备工作&#xff0c;终于是能够一睹ChatGPT的庐山真容&#x…