GPT-4火爆出圈,GPT-5或年底发布?这儿有一份原创最全NLP学习路线请查收!

首先声明:此篇文章非GPT-4生成!由OpenAI发布的GPT-4火爆全网,可预见未来5-10年都将是大模型的天下,它带来了多少本质突破?多少职业会被取代?NLP是否还值得学习以及如果值得具体怎么学?一文带你分析以上问题!

No.1

GPT-4出圈

如果说此前NLP大模型领域的RoBERTa、T5大家还没有了解过,那么此次彻底出圈的ChatGPT、GPT-4则显得的非常“突然”,这也是非专业领域的人们第一次距离NLP前沿如此之近,当然熟悉NLP的领域专家都知道他们都属于Transformer架构,只是基于不同的部分。

先来看看GPT-4 官方论文(Tech Report)中一幅示例图片所展现的能力,用户上传一张图片并问这张图片哪里搞笑?GPT-4的回答已经完全点出了此张图片的幽默之处:“把一个大而过时的VGA接口插入一个小而现代的智能手机充电端口是荒唐的”,这无疑表明GPT-4已经具备多模态信息输入和整合能力。

434b7ab074acba267a94bb1f1c52137c.png

且在GPT-4发布一天后,百度发布文心一言,值得一提的是文心一言具备多模态输出能力,即可以通过文字描述获取图片,下图即为文字生成图片示例。(ps:百度是懂程序员的)

821f9f9bfbe6102b9a024eaaa0e29c73.jpeg

与此同时,谷歌Bard“低调”发布,阿里达摩院类ChatGPT项目也开启内测,就在各厂商纷纷开启跟投模式时,OpenAI在3月24日又发布重磅炸弹,宣布ChatGPT可以继承第三方插件,这意味着购物、机票、订餐等衣食住行领域ChatGPT都可以胜任,这种商业化场景终于让OpenAI背后的资本初步尝到了投资的甜头(毕竟从GPT-1到3代只跑出了一个demo...),此外包括写GPT-4的程序员自身也可能面临“自己训练的出的AI比自己更会写代码题”的局面。

0d8ece7d32e6c2501f5dcad4254e1cd3.jpeg

那是不是就意味着GPT即将完全取代常规文书、会计、内容创作者、画家甚至各领域程序员呢?

No.2

GPT-4会取代谁?

从会计或统计领域,可以让ChatGPT扮演Excel操作者,产出用户想要实现的功能(至于为什么用英文Prompt是由于英文效果更佳,但结尾可以要求中文回答)。

ee7c9ecd6348d6ffd029bd5697900e2f.png

再例如上面提到的程序员,请注意是比自己更会“写代码题”,换句话说只是在互联网数据中对已有结构化的算法题目做“检索”,至于在实战项目中更是无法直接使用,需要人工校验,但是即使这样也已经非常强大,这意味着普通程序员的底层coding基本可以被GPT替代,只需要在此基础上进一步Debug或者Update即可。

因此无论是ChatGPT还是更强大的GPT-4定位更像是辅助型AI,能够在垂直领域帮助人们更好完成职业工作,总而言之,与其说GPT会取代上述职业,倒不如说GPT取代了其中的部分底层工作。

dd2b12f1dffc53d78be5e405d38b47f2.png

No.3

GPT-4会终结NLP吗?

再进一步讲,是不是GPT-4发布之后,NLP领域工作已经被做完了呢?这不禁让我想到英国著名物理学家威廉.汤姆生在回顾物理学所取得的伟大成就时说,“物理大厦已经落成,所剩只是一些修饰工作。”然而正是这些所谓的无关紧要的修饰工作展开成为两朵乌云,第一朵乌云发展出了相对论,另一朵乌云发展成了量子力学。

此时的我们可能就像是当时的威廉.汤姆生,实际上沐神在最近的B站“组会”上也说过Transformer的开发仍处于早期,且当前的prompt范式显然不是终极AI形态,也并没有通过图灵测试,而就在昨天OpenAI官宣GPT-5年底发布,谁也不知道OpenAI究竟超前研发出多少GPT的代际产品... 此后超过 1000 位大佬呼吁“我们应该立即停止训练比 GPT-4 更强大的 AI 系统,暂停期至少 6 个月”,其中包括图灵奖得主 Yoshua Bengio、Stability AI 首席执行官 Emad Mostaque、苹果联合创始人 Steve Wozniak、纽约大学教授马库斯、马斯克,以及「人类简史」作者 Yuval Noah Harari 等等。

5b2985ba2035b082ff08eb1e4fd9c706.jpeg

近期AI三巨头之一Yann Lecun更是声称:从现在5年内,没有哪个头脑正常的人会使用自回归模型,而大佬口中的自回归,正是当前爆红的 GPT 家族模型所依赖的底层学习范式。

1ffbd0510f410b9a744555ebd4517e12.png

因为在LeCun看来,这类模型是没有前途的(Auto-Regressive LLMs are doomed)。尽管他们已经有非常不错的表现,但是有许多问题很难解决,例如事实错误、逻辑错误、前后矛盾、推理有限、容易生成有害内容等。重要的是,这类模型并不了解这个世界底层的事实(underlying reality)。那么年底即将发布的GPT-5是否会解决这一问题可以拭目以待。

68dde65c079306273d11cc31902bef59.png

综上,职业无法被取代,领域研究依然任重而道远,GPT-4相对于NLP或者AI领域来讲无疑是一次技术更迭,会促进人工智能往更加“智能”的方向深入蓬勃发展,所以,还没有学习NLP的同学们或者已经在坑里的同学抓紧上车!

No.4

NLP学习路线

首先是NLP的底层学习路线,随着NLP使用门槛逐渐降低,NLP “SOTA”(即产出比业界最优模型更优的模型)成本越来越高,如何能找到自己的方向,以及如何在自身的方向上有所成就,能够形成自己的核心竞争力,都是值得持续思考的事情。

2ae3087b2c1866c2b7b2d07de75998cd.png

No.5

NLP理论框架

其次进入到NLP庞大的版图中,从word2vec学起,依次到Transformer再到BERT,中间你会感受到自然语言与计算机语言交汇的魅力,且得益于前人的铺路,我们站在torch或者keras的肩膀上以10行代码就能够复现这些研究并且迅速看到专属于自己模型的成果。当然这还远远不够,我们需要进一步调整我们的模型以适配需要,这就需要我们深入学习以下特定领域理论知识以及实战技巧,使得最终成为NLP领域的专家!

6e35bf8b4ab69f95059c99758b63d4a8.png

No.6

NLP论文路线

最后当然得附上NLP领域中经典与即将成为经典的前沿论文导图,其中的论文数量在近年来发布的NLP相关论文中可能1%占比都不到,但绝对是最值得阅读的精选论文,能够以最短时间获取到想要的信息。且论文的阅读上可以优先阅览摘要、引言与结论,如果确定是自己想要读的论文再进一步往下读,这样的阅读顺序是经过反复试验最为高效的。图中所有论文均已上传至公众号,只需要回复【NLP论文】即可获取全部论文PDF合辑!

3571ada8047442c42f654b396c045eff.png

总的来说,自然语言处理(NLP)是一门非常广泛和深入的学科,包括了很多方面,如机器学习、计算机科学、数学、统计学、心理学等等,需要花费大量的时间和精力并且搭配大量阅读与实践才能学到真东西,万事开头难,开始可以搭配一些B站教程或者在线教程进行快速切入和兴趣点收集,慢慢一步一步深入去学,就会发现更多自然语言的奥秘,最后发现文本、图像、视频本质都是一回事,也说不定会走向更高更远的舞台发挥出自己的才能,祝愿大家学有所成,日进斗金!

原创不易,在看收藏都是莫大的分享动力!有任何问题公众号直接留言~

公众号内直接回复【NLP思维导图】即可获取高清PDF下载链接

ceac0c888f8d4507aaff4092d6a9a6f2.png

历史推荐

原创超详细Python学习路线+思维导图

原创最全数据分析师学习路线+思维导图!文末附PDF下载

“高频面经”之数据分析篇

“高频面经”之机器学习篇

“高频面经”之深度学习篇

Selenium爬取京东商品

豆瓣电影top250爬取

Scrapy框架爬取QQ音乐

b5d4db72f229e601987f7d35f028e4b4.png

数据分析与挖掘

数据结构与算法

深度学习与大数据框架

欢迎关注,感谢“在看”,随缘稀罕~

504509d315a70f61ee5a9232a53edfa6.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38665.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

李永乐线性代数手写笔记-特征值和特征向量

李永乐线性代数基础知识,整理放在博客上面,方便自己复习查看。 概览请移步:李永乐线性代数2020年基础课手写笔记汇总 文章目录 一 特征值和特征向量二 相似矩阵三 实对称矩阵 一 特征值和特征向量 二 相似矩阵 三 实对称矩阵

李永乐(六)线性相关——笔记

线性相关 选择证明题是重点 一、判断方法 n个n维向量判断相关无关:计算行列式n-1个n维向量判断相关无关:解齐次方程组,加减消元n1个n维向量必线性相关 二、重要推论 1、 2、 简单证明: 3、 简单证明: 4、 注&…

李永乐(五)向量、线性表出——笔记

这部分内容考研考:选择题,证明题 向量 1、n维向量概念 线性表出 1、线性表出计算题——向量β能否用向量α线性表出 1.1 共三种情况: ①有唯一解②有无数解③无解 1.2 解法: ①向量形式写成方程组形式②写出增广矩阵&#xff…

2022考研数学李永乐线代辅导讲义PDF电子版

李永乐2022线性代数讲义PDF具体链接查看评论区 图片预览 考研建议 关于李永乐线代的问题,可以这么说吧,李永乐老师的线代强化课程,只要全部吃透了,考研的线代就算是已经搞定90%了,还有10%左右的比较新的题型需要在一…

十分钟智商运动 李永乐 有趣的数学 待补充

目录 三次数学危机 学霸与无理数 -500年,希帕索问:直角边都是1,求斜边长度,动摇毕达哥拉斯学派的万物皆是整数芝诺悖论——无穷小 -500年,芝诺把阿基里斯追乌龟的时间分割成无限份,每份无穷小,首…

李永乐(一)行列式计算——笔记

行列式基本性质 一、行列式求值 说明:第 i 行元素 乘 第 j 列的代数余子式 之和 0 二、转置行列式值不变 引申:行有什么性质,列就有什么性质 三、两行互换,行列式值变号 引申:两行相同,行列式值为0 四…

基于PHP实现一个简单的在线聊天功能

一直很想试着做一做这个有意思的功能,感觉复杂的不是数据交互和表结构,麻烦的是前端展..于是.. 需求分析 要实现功能,首先要做前端,经过对比其他网站的在线聊天功能,发现除了基本的聊天功能以外,还要注意以下几点. 1.一次只能和一个人聊天,但是可以随意切换其他人. 2.如果用…

【黄啊码】微信小程序+php实现即时通讯聊天功能

一、PHP7安装Swoole扩展 PHP swoole 扩展下载地址 Github:https://github.com/swoole/swoole-src/tags php官方扩展库:http://pecl.php.net/package/swoole 开源中国:http://git.oschina.net/swoole/swoole/tags 1、自定义安装 # 下载wg…

【黄啊码】我问ChatGPT如何学习PHP语言,它是这么说的

大家好,我是黄啊码,最近大家都在流行整chatGPT,今天它来了!别人都在吹嘘它万能,能够代替程序员写代码,今天我们就让它教教我们学习PHP语言: 黄啊码: 如何有效学习php语言&#xff1…

【亲测可运营】PHP匿名在线聊天室/语音聊天室/多国语言版在线聊天室

简介 PHP匿名在线聊天室源码/自定义群组聊天系统/可设置密码支持自适应多端访问运营版,一款支持多国语言的在线群聊系统源码,可以新建一个群组,然后设置密码,或者公开访问都可以,聊天都是匿名的,方式还是不…

开悟和通货膨胀!!!

大家好,我是txp,今天给大家聊一个非技术性的话题:开悟和抵抗通货膨胀。 不知道大家看到这两个词的时候,是什么感觉,可以停顿一下,让自己思考一下! 在展开这个话题之前,我先总结一下自…

网红马斯克的无聊公司

西雅图IT圈:seattleit 【今日作者】拖拉机 IT圈里烧柴油的干货担当 16年底 美国钢铁侠 埃隆马斯克 成立了一家叫做 The Boring Company (无聊公司) 的微商公司 开始的时候 马斯克声称这家公司 主要从事挖隧道这种无聊的工作 然而这家公司的主…

UE4 摇杆JoyStick-Touch Interface Setup

1.创建 2、属性 USTRUCT() struct FTouchInputControl {GENERATED_USTRUCT_BODY()//自由活动图片// basically mirroring SVirtualJoystick::FControlInfo but as an editable classUPROPERTY(EditAnywhere, Category"Control", meta(ToolTip"For sticks, this …

算法:第一节课Master定理

1、ctex:要求用Tex编辑器进行作业的书写 2、与东大本科有差距,还需要多点努力才行。 3、 4、考试不考概念 5、 6、时间复杂度和空间复杂度 7、算法好坏的评价标准 8、基本运算 9、时间复杂度 10、第二章:重要的来了 11、 12、 13、 假设矩阵…

马斯克 超级计算机,特斯拉布局超级计算机 野心是全自动驾驶

美东时间周一举行的2021年计算机视觉和模式识别会议上,特斯拉人工智能与自动驾驶视觉部门主管安德烈卡帕蒂(Andrej Karpathy)公布了特斯拉超级计算机集群Dojo。卡帕蒂表示,Dojo尚未进行基准测试,根据FLOPS的排名来看,第五位的英伟…

100offer举办的「寻找实干和坚持的技术力量」开源项目投票排名分析程序

2019独角兽企业重金招聘Python工程师标准>>> 由于100offer举办的「寻找实干和坚持的技术力量」开源项目投票活动没有按照票数排序的功能,所以本文写了个小程序来实现这个功能,代码如下: import org.jsoup.Jsoup; import org.jsoup…

qt解析joystick飞行摇杆按键信息

项目场景: 最近入手一款图马斯特飞行摇杆,本来是想用来玩游戏,但是想到以前做过遥控车,如果用这个来代替遥控器应该比较爽,于是用Qt编写了一个解析手柄按键信息的demo软件。 测试效果还不错:下面是demo软…

马思特中国实现2020年全年盈利目标300%

近日,全球著名的金属加工液解决方案企业马思特液体解决方案(以下称“马思特”)公布了2020年度中国区业绩,基于公司在技术研发和人力资源两方面的投入和行业优势,2020年度马思特中国在疫情蔓延下仍然逆势向上&#xff0…

马斯洛提出动机理论_动机理论:工作背后的动力机制

是什么在激励你努力工作呢?下面的要素你是如何排序的?通过填写这样的题项,我们大致能了解到一个人工作的动机是什么,作为雇主我们能根据自身的情况挑选我们需要的某种动机类型的员工,或者设计出更高效的方式来更好满足已有员工需求,为员工创造更大的价值,最终也能够让员…

先进制造业不断发展,马思特以三大优势服务中国市场

近日,马思特液体解决方案(以下称“马思特”)公布中国区业绩。得益于公司团队的密切协作,马思特中国2020上半年即实现全年盈利目标的140%。 “在如此困难的时期一家公司能够保持盈利,有赖于所有员工的共同努力。”马思特…