ChatGPT会对未来5年的NLP算法从业者带来怎样的冲击?

format,png

周末看到知乎的一个问题,有点意思,值得NLPer思考,选取几个回答,欢迎留言。


问题:ChatGPT的诞生意味着模型大一统的可行性,这会对未来5年的NLP算法从业者带来怎样的冲击?

我个人从ChatGPT上看到了很多可能性,也对未来职业生涯更加悲观,或许纳米酱说得对,薅资本主义羊毛,攒够几百万回家考公务员才是正道。

链接:https://www.zhihu.com/question/575391861


作者:张俊林
链接:https://www.zhihu.com/question/575391861/answer/2832979762
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

一言以蔽之:对于NLP研究人员,前景非常不乐观。

ChatGPT这种Instruct based方法,能取得如此惊艳的效果,是出乎很多人意料的,当然,我个人认为它能力的强大,主要还要归因到背后依托的GPT 3.5太强了,这体现了模型规模的魔力。而这意味着很多目前独立存在的NLP研究领域,将被纳入LLM的技术体系,进而不再独立存在,逐步消失。

目前大多数NLP子领域,仍然是以独立研究领域存在的,比如“机器翻译”、“文本摘要”、“QA系统“等,只是切换成在“预训练+fine-tuning/few shot prompting”框架下,面对领域独有问题,陆续提出新的改进方案。目前研究表明,很多NLP任务,随着LLM模型规模增长,效果会大幅提升。据此,我觉得也许我们可以得到如下推论:大多数某领域所谓“独有”的问题,大概率只是缺乏领域知识导致的一种外在表象,只要领域知识足够多,这个所谓领域独有的问题,就可以被很好地解决掉,其实并不需要专门针对某个具体领域问题,冥思苦想去提出专用解决方案。也许事实的真相超乎意料地简单:你只要把这个领域更多的数据交给LLM,让它自己学习更多知识即可。

在这个背景下,未来的技术发展趋势应该是:追求规模越来越大的LLM模型,通过增加预训练数据的多样性,来涵盖越来越多的领域,LLM自主从领域数据中通过预训练过程学习领域知识,随着模型规模不断增大,很多问题随之得到解决。研究重心会投入到如何构建这个理想LLM模型,而非去解决某个领域的具体问题。这样,越来越多NLP的子领域会被纳入LLM的技术体系,进而逐步消失。

我认为,判断某个具体领域是否该立即停止独立研究,其判断标准可采取以下两种方法,占其一即可:第一,判断某个任务,是否LLM的研究效果超过人类表现,对于那些LLM效果超过人类的研究领域,已无独立研究的必要。举个例子,GLUE与SuperGLUE测试集合里的很多任务,目前LLM效果已超过人类表现,与这个数据集合密切相关的研究领域,其实就没有继续独立存在的必要。第二,对比两种模式的任务效果,第一种模式是用较大的领域专用数据进行Fine-tuning,第二种是few-shot prompting或instruct-based方法。如果第二种方法效果达到或超过第一种方法,则意味着这个领域没有继续独立存在的必要性。如果用这个标准来看,其实很多研究领域,目前fine-tuning效果还是占优的(因为这种模式领域训练数据量大),看似还可独立存在。但是考虑到很多任务随着模型规模增大,few shot prompting/instruct效果持续增长,随着更大模型的出现,这个拐点很可能短期就会达到。

如果上述猜测成立,将意味着如下残酷事实:对于很多NLP领域的研究人员,将面临往何处去的选择,是继续做领域独有问题呢?还是放弃这种看似前途不大的方式,转而去建设更好的LLM?如果选择转向去建设LLM,又有哪些机构有能力、有条件去做这个事情呢?我们很多人可能早晚要面对这些问题,并给出自己的选择。

当然,我个人表示情绪稳定,对我基本没啥影响,因为在T5出现之后,我就知道自己已经没有能力做LLM这个事情了。


作者:郑楚杰
链接:https://www.zhihu.com/question/575391861/answer/2833726655
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

  1. 对于 R&D 可能影响不大,毕竟做的事一直都是 follow 国际大厂的前沿工作,他们出什么就跟进什么就好了

  2. 对于垂直领域的  可能会产生较大冲击。当 LMaaS 普遍后,竞品都基于同样的基础模型,能力下限大大提升,行业门槛大大下降。仅存的护城河就是里的数据积累(但效用会随着 LLM 变得更强而下降)

  3. 对于 NLP 研究者(包括 AI Lab、高校研究室)、特别是垂直领域可能冲击最大。通用 LLM 方法让垂直领域的细分/长尾问题上的 incremental improvement 很难再有大的价值和影响力,你费老大劲都只能缓解的问题可以被 LLM 直接解决

由于我自己还在读博,关于 3 可能感受更深,再说两句

以往国内学术界/工业界对于 LLM 的传统认知是「计算开销大、生成慢、落地难,过于 magic」,即使到现在这也是「LLM 没有未来」的一个主要论据。但我们需要注意到几方面事实:

  1. OpenAI 提供的 LMaaS 服务(toB 和 toC)已经具备很高的速度(很低的 latency),并构成了行之有效的盈利模式

  2. 2022 年的大量前沿研究都在探索和拓展 LLM 的极限和边界,这进一步促进了 1

  3. 2 中的这些研究都是出自国际大厂,国内几乎已经缺席了 LLM 的前沿研究

  4. 由于实力的不对等,OpenAI、Google、DeepMind 等 LLM 头部玩家可能不再会公开最前沿的 LLM 研究进展(转为挤牙膏模式)

以上事实意味着:当国际大厂用上了更低成本、更好性能的 LLM 技术使其落地时(尤其是极富潜力的生产力场景),国内可能还在认为 LLM 落地难而止步不前,而这仅仅是因为前者没有公开技术或指明可能性。换而言之,等 GPT-4 出来后,国内的专家们可能又会说「大模型落地难,实际应用还得靠中小模型」,但「OpenAI 的大模型成本或许比你的中小模型还要低」,更不用说 OpenAI 的中小模型(如 6B~13B)的性能已经远超一众超大模型(如 130B~175B)。在这一趋势下,国内与国际前沿的技术鸿沟会越来越大,甚至无法追赶

那么对于研究人员来说,如何判断自己研究的问题在 LLM 时代下还有没有价值?

@张俊林

的回答其实说得已经很好了。我个人认为最核心的两个依据是:

  1. 这个问题是否是通用领域问题?如 LLM 的可解释性、训练与提示技巧、模型压缩和加速

  2. 这个问题是否会被 scaling 解决?如果  可以解决,或者方法带来的提升随着 scaling 而减小,那么研究的价值和影响力可能就会极为有限。如果对学术/技术影响力有更高的追求,在资源和条件允许的情况下,则应该转向通用领域的问题开展研究


作者:潘浩杰
链接:https://www.zhihu.com/question/575391861/answer/2833613607
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

我倒是看到了新的希望,如果是纯做NLP中台(而不是直接做搜索广告等)现在在业界本就是锦上添花的角色,且一些中台服务如机器翻译等基本趋近饱和。

但LLM在国外如火如荼,Model as a Service 在国内也越来越重视。新的范式会引起新的变革,对业内从业者而言就可以有新的事情可以尝试。

我认为最受冲击的可能是思维还停留在deep learning for nlp时代的,或者BERT for everything时代的,新的浪潮下转弯不够快就很容易落伍。比如我17-18年做chatbot的时候,都是seq2seq+pgn生成出来一堆跟上下文无关、缺乏多样性、刷blue和rouge指标的没有意义的response,其后几年脑海里都是“文本生成不可信任,nlp唯一killer application只有翻译,新的工作不就是xxx”,现在跟很多小同学交流才发现自己才工作两年多就已经慢慢落后了。

另假如对NLP有更深的信仰,希望能有更拟真的对话AI的同学而言,就更是利好信息了。


作者:多头注意力
链接:https://www.zhihu.com/question/575391861/answer/2833012173
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

题主用了冲击一词,应该认为影响比较负面。我倒是认为不一定,特别是应用端,以下是几点想法:

  1. 大模型再牛也需要调包侠写代码。模型应用到业务还是有很多工作需要做的。评论区有朋友说直接调用API只需要开发同学就行了,没错,【调用】这个动作确实很容易,但chatgpt 并不是个像查天气,查邮编这样确定性的api,prompt 的设计,结果的校验都是需要不少工作的。

  2. 技术有突破有利于行业繁荣,特别是在一个比较短的时间内(题主问五年内)。参考2013年后卷积神经网络带来的行业热潮和2017年后预训练语言模型带来的行业热潮。

  3. 从业者的工作方式肯定会改变。重要的是跟上趋势,不要抱着原来的技术和方法不放。这个情况也不是没有经历过,词向量时代大家花大量时间减少OOV ,bert 出来后几乎没人关心这个了。当时bert 出来大家也感叹以后炼丹容易了,会冲击行业,但实际结果并没有。如果在现在一个nlp 工程师还不会使用预训练语言模型,那可能对他的职业发展确实是有【冲击】。

  4. 工具的进步是会释放创意潜力的,所谓学以致用,可以多思考怎么用。

至于研究者,比较认可

@张俊林

的回答,影响会大一些。

一起交流

想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定o要备注信息才能通过)

format,png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8730.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI 账户验证流程存在漏洞,可导致用户无限薅羊毛

聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 Checkmarx 公司指出,OpenAI 的账户验证流程中存在一个漏洞,可导致任何人使用同一个电话号码注册新账户后,获得无限制的服务额度。 作为人工智能公司&…

赚翻了!外国小哥用ChatGPT完成80%工作,同时打4份工

Datawhale分享 最新:ChatGPT应用,编辑:新智元 【导读】自从ChatGPT火了以后,办公室白领可真是爽翻了。甭管什么任务,交给ChatGPT,准没错。 不少白领在工作中都用上了ChatGPT,堪称如虎添翼。 毕…

ShardingJDBC读写分离

ShardingJDBC是什么 看一看ChatGPT对他的解释: ShardingJDBC是一个数据库连接池,它为数据库的分片和读/写拆分提供支持。它允许您跨多个物理数据库和服务器分发数据,并根据设置的配置将读写操作路由到适当的数据库。 以下是它的工作原理&…

为什么总是闹离职的员工没走,平时不吭声的员工却突然离职?

上一篇:华为“天才少年”稚晖君被曝离职!两年前加入年薪百万起步的天才少年计划! 相信工作过几年的朋友都遇到过类似的现象:总是闹离职的员工没走,平时不吭声的员工却突然离职。 其实很正常,总是闹离职的说…

盘点海外 AIGC 独角兽创始人,中国何时迎来自己的高光时刻?

据不完全统计,全球 AIGC 创业公司中估值在 10 亿美元以上的已经多达 10 家。包括推出 ChatGPT 的 OpenAI,因《太空歌剧院》而走红的 Midjourney 等。这些独角兽背后的创业者都是谁?他们又是如何成为时代的开创者?本篇文章带你一看…

适合程序员使用的 ChatGPT!!!

ChatGPT 不仅能解决亲情,友情,爱情等非常热门的问题,还能帮助程序员在开发中反复测试自己的代码或者切磋技艺。 例如,作为程序员的我们,只要在ChatGPT上轻轻松松地输出我们的需求,“null pointer怎么解决啊…

1 分钟高效集成 ChatGPT,Stable Diffusion 等 AIGC 模型最强教程

1 分钟能做什么?集成 ChatGPT 到自己的公众号,小程序或者 APP?集成各种形式的 Stable Diffusion,让 AIGC 帮助自己的项目更有趣,更生动?本教程将会教大家如何 1 分钟高效集成 ChatGPT,Stable Di…

【起飞】让你电脑速度快到飞起的一些牛逼的设置整理【电脑卡顿反应慢等问题解决】

对于开发来说电脑的反应速度简直影响了思维的速度,要让电脑速度跟上我们的思维,提高工作效率,早点打卡下班回家陪老婆孩子哈哈 这篇文章主要对windows系统做的一些优化,是真的好用,仿佛在访问静态页面一样,…

【Redis】孔夫子旧书网爬虫接入芝麻代理IP:代理IP利用效率最大化

背景: 之前用过芝麻IP,写过这几篇文章 《【Python】芝麻HTTP代理系列保姆级全套攻略(对接教程自动领取每日IPIP最优算法)》 《【Python】记录抓包分析自动领取芝麻HTTP每日免费IP(成品教程)》 《爬虫增加代理池:使用稳…

高通410 随身WIFI刷入Debian系统(玩法合集)

引言 刚接触到这个项目是在b站上,刷到一位UP主的视频:https://b23.tv/xAFWiTF 其实现了在搭载高通410芯片的随身WIFI烧录linux系统,并在上面部署了chatGPT-Next网站服务。 本人参考的教程链接和其教程所有工具:https://pan.bai…

chatgpt赋能python:Python如何薅羊毛?

Python如何薅羊毛? 近年来,Python已经成为了越来越多程序员的首选编程语言。除了在技术领域得到广泛应用,Python还可以被用于一些非正当途径,比如薅羊毛。在这篇文章中,我们将会学习如何利用Python来薅羊毛。 什么是…

【ChatGPT】GPT实现原理大解析——看完就知道什么叫颠覆

文章目录 前言一、ChatGPT是什么?二、那么,如何计算下一个单词的概率?三, 什么是模型?四,如何制作能完成人类任务的模型五,神经网络总结 前言 ChatGPT 能够自动生成类似于人类写作的文本&#…

多平台发布文章怎么做?自媒体多平台发内容教程分享

目前很多小伙伴着手做自媒体全部都是在一些自媒体视频或是时尚博主的推荐下才了解到做自媒体可以为自己创造收入,刚开始做得时候或许只是会弄两三个账户,察觉收入也并不高,便不愿意去做相应的事情了,确实目前做自媒体的人太多了&a…

自媒体文章同步该怎么做?有什么办法可以一键同步到多自媒体平台

在自媒体行业当中,有很多人的苦恼就是应该如何将自己的创作内容同时发布在各大媒体上,应该进行什么样的步骤才能够进行同步。那我们需要在各大平台进行授权,才能够进行同时发布,不仅非常的繁琐,而且在管理账户方面更容…

自媒体一篇文章能多平台发布吗?

如今是全民自媒体时代,只要热爱创作,并且懂得网络知识的人们,就可以成为自媒体人,自媒体这个行业存在竞争,能否在竞争中脱引而出,能否利用自媒体平台赚钱,与个人眼光、写作水平以及所用工具存在…

头条发布文章如何一篇文章发布道30+自媒体平台?

很多从事自媒体工作的朋友都会借助工具来帮助自己工作,这种工具能批量发布30多个平台的工具,很多人都应该听说过头条号,也是一个著名的自媒体平台。许多作者已经在使用了,收入相当可观。许多自媒体工作室经营多个账号,…

自媒体平台批量文章采集

多个平台自媒体文章采集,今日头条、微信公众号、知乎、豆瓣、小红书这些自媒体平台明天都会产出海量的优质文章,通过对这些平台相关文章进行采集,能获取大量的热门素材,不管是自己创作还是内容分析,都十分便利。 多个平…

自媒体同篇文章多平台发布,自媒体人提高效率利器

写完文章发布后,也需要同步到其他平台。在这种重复发布的一个工作操作当中,我们可以同时发布到各个平台,这样会减少我们的宝贵创作时间。如果在没有一件同时发布之前,我们做自媒体行业是比较困难的。其中。也有这么一款软件&#…

自媒体原创文章多平台发布操作方法教程!

我相信很多自媒体朋友可能会有问题,因为他们已经注册了多个多媒体平台。在我们写完一篇文章后,我们需要将其逐一复制粘贴到每个平台的编辑器中。这么多的帐户没有多个平台的一键发布工具的帮助,我们每天都会登录该帐户。现在,让我…

自媒体人如何打造出爆文?这3种类型的文章最容易爆

爆文是一直是自媒体人的终极目标,要想打造出爆文却不是那么容易的事,借助热点无疑是热点爆文的一种速成法,今天就给大家分享几个自媒体爆文写作的技巧! 01 综合热点文 第一种就是综合热点文——热点话题有可预测性,也…