首先声明:此篇文章非GPT-4生成!由OpenAI发布的GPT-4火爆全网,可预见未来5-10年都将是大模型的天下,它带来了多少本质突破?多少职业会被取代?NLP是否还值得学习以及如果值得具体怎么学?一文带你分析以上问题!
No.1
GPT-4出圈
如果说此前NLP大模型领域的RoBERTa、T5大家还没有了解过,那么此次彻底出圈的ChatGPT、GPT-4则显得的非常“突然”,这也是非专业领域的人们第一次距离NLP前沿如此之近,当然熟悉NLP的领域专家都知道他们都属于Transformer架构,只是基于不同的部分。
先来看看GPT-4 官方论文(Tech Report)中一幅示例图片所展现的能力,用户上传一张图片并问这张图片哪里搞笑?GPT-4的回答已经完全点出了此张图片的幽默之处:“把一个大而过时的VGA接口插入一个小而现代的智能手机充电端口是荒唐的”,这无疑表明GPT-4已经具备多模态信息输入和整合能力。
且在GPT-4发布一天后,百度发布文心一言,值得一提的是文心一言具备多模态输出能力,即可以通过文字描述获取图片,下图即为文字生成图片示例。(ps:百度是懂程序员的)
与此同时,谷歌Bard“低调”发布,阿里达摩院类ChatGPT项目也开启内测,就在各厂商纷纷开启跟投模式时,OpenAI在3月24日又发布重磅炸弹,宣布ChatGPT可以继承第三方插件,这意味着购物、机票、订餐等衣食住行领域ChatGPT都可以胜任,这种商业化场景终于让OpenAI背后的资本初步尝到了投资的甜头(毕竟从GPT-1到3代只跑出了一个demo...),此外包括写GPT-4的程序员自身也可能面临“自己训练的出的AI比自己更会写代码题”的局面。
那是不是就意味着GPT即将完全取代常规文书、会计、内容创作者、画家甚至各领域程序员呢?
No.2
GPT-4会取代谁?
从会计或统计领域,可以让ChatGPT扮演Excel操作者,产出用户想要实现的功能(至于为什么用英文Prompt是由于英文效果更佳,但结尾可以要求中文回答)。
再例如上面提到的程序员,请注意是比自己更会“写代码题”,换句话说只是在互联网数据中对已有结构化的算法题目做“检索”,至于在实战项目中更是无法直接使用,需要人工校验,但是即使这样也已经非常强大,这意味着普通程序员的底层coding基本可以被GPT替代,只需要在此基础上进一步Debug或者Update即可。
因此无论是ChatGPT还是更强大的GPT-4定位更像是辅助型AI,能够在垂直领域帮助人们更好完成职业工作,总而言之,与其说GPT会取代上述职业,倒不如说GPT取代了其中的部分底层工作。
No.3
GPT-4会终结NLP吗?
再进一步讲,是不是GPT-4发布之后,NLP领域工作已经被做完了呢?这不禁让我想到英国著名物理学家威廉.汤姆生在回顾物理学所取得的伟大成就时说,“物理大厦已经落成,所剩只是一些修饰工作。”然而正是这些所谓的无关紧要的修饰工作展开成为两朵乌云,第一朵乌云发展出了相对论,另一朵乌云发展成了量子力学。
此时的我们可能就像是当时的威廉.汤姆生,实际上沐神在最近的B站“组会”上也说过Transformer的开发仍处于早期,且当前的prompt范式显然不是终极AI形态,也并没有通过图灵测试,而就在昨天OpenAI官宣GPT-5年底发布,谁也不知道OpenAI究竟超前研发出多少GPT的代际产品... 此后超过 1000 位大佬呼吁“我们应该立即停止训练比 GPT-4 更强大的 AI 系统,暂停期至少 6 个月”,其中包括图灵奖得主 Yoshua Bengio、Stability AI 首席执行官 Emad Mostaque、苹果联合创始人 Steve Wozniak、纽约大学教授马库斯、马斯克,以及「人类简史」作者 Yuval Noah Harari 等等。
近期AI三巨头之一Yann Lecun更是声称:从现在5年内,没有哪个头脑正常的人会使用自回归模型,而大佬口中的自回归,正是当前爆红的 GPT 家族模型所依赖的底层学习范式。
因为在LeCun看来,这类模型是没有前途的(Auto-Regressive LLMs are doomed)。尽管他们已经有非常不错的表现,但是有许多问题很难解决,例如事实错误、逻辑错误、前后矛盾、推理有限、容易生成有害内容等。重要的是,这类模型并不了解这个世界底层的事实(underlying reality)。那么年底即将发布的GPT-5是否会解决这一问题可以拭目以待。
综上,职业无法被取代,领域研究依然任重而道远,GPT-4相对于NLP或者AI领域来讲无疑是一次技术更迭,会促进人工智能往更加“智能”的方向深入蓬勃发展,所以,还没有学习NLP的同学们或者已经在坑里的同学抓紧上车!
No.4
NLP学习路线
首先是NLP的底层学习路线,随着NLP使用门槛逐渐降低,NLP “SOTA”(即产出比业界最优模型更优的模型)成本越来越高,如何能找到自己的方向,以及如何在自身的方向上有所成就,能够形成自己的核心竞争力,都是值得持续思考的事情。
No.5
NLP理论框架
其次进入到NLP庞大的版图中,从word2vec学起,依次到Transformer再到BERT,中间你会感受到自然语言与计算机语言交汇的魅力,且得益于前人的铺路,我们站在torch或者keras的肩膀上以10行代码就能够复现这些研究并且迅速看到专属于自己模型的成果。当然这还远远不够,我们需要进一步调整我们的模型以适配需要,这就需要我们深入学习以下特定领域理论知识以及实战技巧,使得最终成为NLP领域的专家!
No.6
NLP论文路线
最后当然得附上NLP领域中经典与即将成为经典的前沿论文导图,其中的论文数量在近年来发布的NLP相关论文中可能1%占比都不到,但绝对是最值得阅读的精选论文,能够以最短时间获取到想要的信息。且论文的阅读上可以优先阅览摘要、引言与结论,如果确定是自己想要读的论文再进一步往下读,这样的阅读顺序是经过反复试验最为高效的。图中所有论文均已上传至公众号,只需要回复【NLP论文】即可获取全部论文PDF合辑!
总的来说,自然语言处理(NLP)是一门非常广泛和深入的学科,包括了很多方面,如机器学习、计算机科学、数学、统计学、心理学等等,需要花费大量的时间和精力并且搭配大量阅读与实践才能学到真东西,万事开头难,开始可以搭配一些B站教程或者在线教程进行快速切入和兴趣点收集,慢慢一步一步深入去学,就会发现更多自然语言的奥秘,最后发现文本、图像、视频本质都是一回事,也说不定会走向更高更远的舞台发挥出自己的才能,祝愿大家学有所成,日进斗金!
原创不易,在看收藏都是莫大的分享动力!有任何问题公众号直接留言~
公众号内直接回复【NLP思维导图】即可获取高清PDF下载链接
历史推荐
原创超详细Python学习路线+思维导图
原创最全数据分析师学习路线+思维导图!文末附PDF下载
“高频面经”之数据分析篇
“高频面经”之机器学习篇
“高频面经”之深度学习篇
Selenium爬取京东商品
豆瓣电影top250爬取
Scrapy框架爬取QQ音乐
数据分析与挖掘
数据结构与算法
深度学习与大数据框架
欢迎关注,感谢“在看”,随缘稀罕~