GPT-4的前世、今生和未来!

作者 | 王思若  编辑 | 夕小瑶的卖萌屋

点击下方卡片,关注“自动驾驶之心”公众号

ADAS巨卷干货,即可获取

前言

诚然,从关系数据库到互联网信息检索,每一次知识表示和调用方式的跃迁都会在科技史引起一场巨大的技术变革。当ChatGPT发布之后,生成式AI成了新的技术范式,这场变革从微软、Google、百度这一众搜索引擎开始,星火燎原,越来越多的工作将会发生不可逆转的改变,有研究声称至少80%的工作都将或多或少受其影响[1]

在这场狂欢之中,有声称5000万美金入局的投资者,有李沐等技术大牛离职做大模型创业,声音越来越嘈杂,大有风雨欲来之势。主流的声音慢慢从技术的探讨变成了“AI取代人类”的惶恐不安,警告人们‘不要温和地走入那个良夜’,更不乏有人开始去思考人类是否可以创造一个全知全能的神这样的终极命题。

有人狂喜,声称自己是ChatGPT的忠实拥趸;有人毫不关心,认为又是一个资本鼓吹的泡沐。无论哪种视角,这都将是一场势不可挡的技术浪潮,在这里,我们追溯从GPT-1到GPT-4的时间线[2],挑拨缕析地探讨一下GPT-4的前世、今生和未来!

a351492121256767993fb40682ebbb1a.png一、前世1528b10210e33de2b079feb41a9a8952.png

如果追溯GPT系列发展的时间线,我们会发现这是一项横跨五年的技术探索,从GPT-2到GPT-3,其实也只是在几乎不改变模型框架的基础上从15亿的参数量迭代到1750亿,不同于Google推出T5、Switch Transformer和PaLM等一系列大模型的赛马机制,OpenAI‘矢志不渝’地坚持着GPT路线。

c4de07e4c008db636372634bbf80a378.png

这种坚持在现在看来也尤为不易。2020年,OpenAI提出了大模型的缩放法则(Scaling Laws),增大参数规模可以极大提升模型性能一时成为了“金科玉律”,由此也开启了炼大模型的‘狂飙’时代。1760亿参数的BLOOM、5300亿的MT-NLG、5400亿的PaLM、更有‘贪心者’用MoE(Mixture of Experts)架构强行将参数量堆叠到了万亿,当时关于GPT-4模型参数量将达到100万亿的谣言一时甚嚣尘上。

但如果把视角拉到22年年中,我们会发现国内几乎所有人都在造大模型狂刷SOTA之后迷茫了,学术界‘fine-tune’和‘promot’的百般招式皆已用上,工业界又难以对大模型落地,‘顶不了天,立不了地’,留下的只是盲目跟风追求大模型之后的“一地鸡毛”。一方面Epoch AI 发文称语言数据将在2026年耗尽[3],另一方面越来越多的inverse scaling现象(逆向缩放,即模型规模越大,效果越差)不断被发现[4],超大模型的前进道路似乎弥漫着茫茫迷雾。

然而,当继续加大模型规模并在超过某个阈值之后,模型性能出现了井喷式的能力提升,这种神奇的现象被称作大模型的涌现性。例如,随着模型规模的进一步提升,研究人员发现模型准确率会呈现“ U 型”曲线[5],超大规模的模型似乎在某个临界点之后不可预料得表现出极为强大的能力。新的进步与发现似乎完全改变了游戏规则,很多提示增强(augmented prompting)技术在小模型上并没有效果,但在模型达到某个规模之后会突然有效。

10e6f6d3195f9e5e084ebe910ca52555.jpeg

在此背景下,OpenAI将RLHF(人类反馈强化学习,Reinforcement Learning from Human Feedback)技术应用到GPT-3模型中,简而言之,RLHF 将预训练语言模型按照人类反馈进一步微调以符合人类偏好。看似简单,RLHF这条道路,OpenAI同样走了五年[6]

  • 2017年,OpenAI提出该技术,少量人类反馈作为奖励函数得以让系统处理复杂任务,在Atari游戏上表现出不错的效果,‘小火柴棍’学会了后空翻[7]

  • 2021年,OpenAI利用该技术进行摘要生成,雇佣了80 位人工标注者生成了6.48万条数据对模型进行调校,粗略计算仅标注数据的成本就在300万左右[8,9]。,这一工作证明了RLHF确实能够在语言模型上奏效,可以针对人类价值观等模糊的目标进行优化。

  • 2022年,OpenAI将RLHF应用于GPT-3并开发出InstructGPT,相对于GPT-3更善于遵循用户意图,虽然参数量只有1.3B,比175B GPT-3模型参数少了100多倍,但更加遵循指令和事实,并大幅度减少有毒输出(toxic generation),微调成本更是只有GPT-3的2%。

f709c9e911c490b15d771ea5daa26335.png

RLHF应用开发ChatGPT的技术路线

OpenAI宣称RLHF是一种“有效提升AGI(通用人工智能系统)与人类意图对齐的技术”,但OpenAI对齐团队负责人Jan Leike坦言,优越对齐能力的出现并未有坚实的理论基础,换言之,该方法只是秉持着“评估比生成更容易”的动机而不是正式的理论。

回归主题,基于RLHF技术,OpenAI构造了ChatGPT。当然,更重磅的新闻是所有人翘首以盼的GPT-4来了,OpenAI创始人Sam Altman开门见山的简绍说这是我们迄今为止功能最强大的模型,一个史上最强大的多模态模型!

一场技术革命似乎开始了。《财富》杂志描述其为Netscape Navigator(网景)时刻:在一代人的时间中总有一种产品的出现,它将工程技术从昏暗的地下室、书呆子们臭气熏天的卧室和爱好者们孤独的洞穴中发射出来,变成了你的祖母都知道如何使用的东西。早在1990年就诞生了网络浏览器,但直到1994年Netscape Navigator(网景浏览器)的出现,大多数人才发现了互联网。我们现在迎来了AI的Netscape Navigator 时刻!

4a99c2ae6567ba5fc8c521bd889fa659.png二、今生9c92470522da04336bb10e6f8d5f57a4.png

2b5f37547d0d9d286f6d2aac88afd62a.png

接着上述时间线:

  • 3月14日,GPT-4发布,OpenAI给出了技术报告和3分钟的预告片。GPT-4支持多模态,能够识图、生成歌词、做网站,并且刷爆了人类社会各个领域的考试,已经达到了哈佛、斯坦福等顶尖高校的水平。现已集成到微软New Bing和ChatGPT Plus。

  • 3月16日,OpenAI 的首席科学家兼联合创始人Ilya Sutskever表示OpenAI不会分享更多关于GPT-4的信息。Sutskever表示出于竞争和安全的考量,当然主要是同行的竞争,当被问及为什么 OpenAI 改变了分享其研究成果的方式时,Sutskever 简单地回答说:坦率地说,我们错了。如果你像我们一样相信,在某个时候,人工智能将变得极其强大,那么开源就没有意义了,我完全希望在几年内,每个人都会完全清楚开源 AI 是不明智的[10]

  • 3月17日,微软Microsoft 365全面引入生成式AI助手Copilot,将GPT-4集成到了Word、Excel、PowerPoint、Outlook和Teams等应用中,用户可以提出问题并提示AI撰写草稿、制作演示文稿、编辑电子邮件、制作演示文稿、总结会议等。

  • 3月20日,OpenAI发布了GPT模型和技术对劳动力市场潜在影响的论文,预计将影响80%的工作岗位[11]

已构建好技术壁垒的OpenAI开始拒绝技术开源,甚至DeepMind 首席执行官 Demis Hassabis也同样表示:我们正在进入一个时代,我们必须开始考虑贪图便宜的人,或者那些正在阅读但没有为该信息库做出贡献的人,这也包括民族国家,这很明显,你可能会想到谁。他表示人工智能行业公开发布其发现的文化可能很快需要结束[12]

不知道大家对此作何感想?

这里OpenAI 的前政策主管 Jack Clark 做了我的嘴替,Clark强烈反对GPT-4,他表示:事情变得越来越奇怪,这更像是一个政治时刻,而不是技术时刻,GPT-4 基本上是通过计算呈现的硬实力政治,GPT-4 无疑会引起社会变革,但同样会因垄断引发重大的政治反弹[13]

回归到技术本身,OpenAI表示在发布GPT-4之前,他们花费了八个月进行安全研究、风险评估和迭代,因此,GPT-4的初始可用日期是在2022年8月。GPT-4是包括视觉语言模型组件的大型语言模型,类似于DeepMind的Flamingo模型,输入可以是文本或图像,但所有的输出都是文本。

GPT-4 的数据收集是由 Wojciech Zaremba(数据集团队经理)和 Qiming Yuan(数据集采购和处理负责人)领导的一项艰巨任务。数据集贡献来自一个由 35 名 OpenAI 员工组成的团队。在预训练阶段,OpenAI过滤了 GPT-4 的数据集组合,以专门减少不适当的色情文本内容的数量。通过结合内部训练的分类器和基于词典的方法来识别被标记为极有可能包含不当色情内容的文档。

OpenAI 拥有利用来自包括谷歌在内的竞争对手的其他数据集的经验[15], 依赖最先进的 DeepMind MassiveText 和 Google Infiniset数据集,且OpenAI 与 Microsoft 的合作伙伴关系允许访问 GitHub 等大型数据集,我们可以推测GPT-4可能是在1.7T-2.9T的文本tokens上进行的训练,模型参数量包括800-1400亿的语言模型参数+200亿的视觉模型参数。

e8fb62241affc42f084e3f254a635031.png

此外,GPT-4的文本生成长度被显著提高,一个token通常对应大约 4 个字符,而1个汉字大致是2~2.5个token,在GPT-4之前,token的限制大约在4096左右,大约相当于3072个英文单词,一旦对话的长度超过这个限制,模型就会生成不连贯且无意义的内容,到了GPT-4其最大的token数是32768个,大约相当于24576个单词,相当于48页文本,生成长度被扩大了八倍。

4ae1e91cea090ca843cebbd140b81462.png

GPT-1到GPT-4的上下文窗口数量,注:目前GPT-4限制的上下文长度限制为8192个token,允许32768个token的版本名为GPT-4-32K,目前暂时限制了访问权限。

就价格而言,GPT-4 比 ChatGPT 贵大约 30 倍,比 GPT-3 davinci 贵大约 3 倍。

76a92798e10894905cebed06141a5a0c.png

698d9ba4cfbf7f5f34f19cecf48188ba.png三、未来11222657bc1d9d6f7d97d32fd2e19723.png

我们可以从GPT-4的结果就可以看到其巨大的潜力,美国高考SAT:1410(满分1600,前6%),美国大学预科考试AP:100%(5/5)。有人在去年8月就获得了GPT-4的访问权限,并用其写了一本书-----Amplifying our Humanity through AI(通过人工智能放大我们的人性)[15,16]

当然未来的潜力远不止如此,我们可以从和GPT-4的合作企业管中窥豹。

94f34e4c3cfcc784c92dba90bc922297.png
  • 和教育行业合作,去一探学习的未来,和可汗学院(khan academy,教育性非盈利组织)合作推出Khanmigo,和多邻国(Duolingo,语言学习软件)推出Duolingo Max,让AI去辅导学生作业和学习外语。

  • 和IT行业合作,集成到微软Bing和Microsoft 365全家桶上,重新定义了生产力;发布AI 聊天机器人Fin等,这将会是第一个最懂你的AI机器人;集成到笔记软件Mem中,辅助我们去畅想未来,探索未知。

  • 和专业服务公司合作,联合波士顿咨询公司合作推出BCG X,汇集了先进的技术知识和雄心勃勃的企业家精神,可帮助组织开展下一次重大投资并实现大规模创新。

  • 在其合作名单中,甚至有可口可乐公司,摩根士丹利等金融服务公司和冰岛等政府机构。

这一次,工作范式将要改变,我们可以将越来越多的事务托付给AI完成,人类将会有更多的自由和可能,甚至某一天人类可能会将思考的权力也让渡给了AI,那个时候我们就要去重新追寻人类的价值,而这对于我们而言,依然有很长的路要走!

往期回顾

史上最全综述 | 3D目标检测算法汇总!(单目/双目/LiDAR/多模态/时序/半弱自监督)

视频课程来了!

自动驾驶之心为大家汇集了毫米波雷达视觉融合、高精地图、BEV感知、传感器标定、传感器部署、自动驾驶协同感知、语义分割、自动驾驶仿真、L4感知、决策规划、轨迹预测等多个方向学习视频,欢迎大家自取(扫码进入学习)

86cca850009f4516187ec48bf6990996.png

(扫码学习最新视频)

国内首个自动驾驶学习社区

近1000人的交流社区,和20+自动驾驶技术栈学习路线,想要了解更多自动驾驶感知(分类、检测、分割、关键点、车道线、3D目标检测、Occpuancy、多传感器融合、目标跟踪、光流估计、轨迹预测)、自动驾驶定位建图(SLAM、高精地图)、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布,欢迎扫描下方二维码,加入自动驾驶之心知识星球,这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频,期待交流!

ab27212c0305b70d5d5c6ac58e1f0ac2.jpeg

自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多传感器融合、SLAM、光流估计、深度估计、轨迹预测、高精地图、NeRF、规划控制、模型部署落地、自动驾驶仿真测试、产品经理、硬件配置、AI求职交流等方向;

22b39114b595d94615197555746b59ed.jpeg

添加汽车人助理微信邀请入群

备注:学校/公司+方向+昵称

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5243.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Auto-GPT的5大用例:建网站、当客服、数据分析......

Auto-GPT仅用了30多天的时间在github就突破了10万颗星,成为一款风靡全球的开源程序。Auto-GPT帮助ChatGPT突破了AI的界限,充当其“四肢”使得跨业务流程、平台实现超级自动化成为了可能。 由于Auto-GPT调用的是GPT-3.5或GPT-4的API,在代码开…

集成 GPT-4,动动嘴就能上线一个网站,这个工具强的离谱!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 自 GitHub Copilot X 正式问世以来,已经快过去半个月了。 在产品发布当天,最震撼我的,不是 AI 助理 Copilot Chat,也不是智能命令行 Copilot…

python的发展方向有哪些?

Python是一门面向对象的编程语言,编译速度超快,从诞生到现在已经25个年头了。它具有丰富和强大的库,常被称为“胶水语言”,能够把用其他语言编写的各种模块(尤其是C/C)很轻松地联结在一起。其特点在于灵活运用,因为其拥…

Python赚外快指南!找点轻松的活增加收入!

当今收入低于5000的人至少占到40%,完全不够养活一家人,而且很多小伙伴其实空余时间比较多,特别是大学生,零花钱又不够花,都想靠业余时间找点轻松的活增加收入。但是缺没门路,为此结合我多年编程开发经验&am…

GPT 即将为软件工业化开发带来“贾维斯时刻”!

大语言模型的出现让很多人担心劳动岗位替代的问题,但是,首先要“瑟瑟发抖”应该是企业当前的开发模式,这是释放工具潜力的关键。 作者 | 付晓岩 责编 | 梦依丹 出品 | CSDN(ID:CSDNnews) GPT 最近几乎…

微软许建志:AI-First App,一个既残酷、又美好的时代

责编 | Carol 出品 | CSDN(ID:CSDNnews) 内容编辑应该都有做网站专题的经历,通过给定网站模板套用来搭建页面。这样确实方便,但问题是对于千变万化的内容,并非几套,或者数十上百套模板就能够尽情…

三个Chat*GPT的创业机会,如何让它赚钱变现

今天是回来的第三个月了,回来就开始走上ChatGPT创业的这条路上,辛酸苦辣只有自知,晚上一点多了,团队都还在加班,我也还在写文章,也是痛并快乐着,废话不多说; 今天分享的三个赚钱变现…

GPT-4 重磅发布!零基础也能一秒做网站了?

大家好 当我还沉浸于收集各种基于 chatgpt 开发的 AI 效率神器时,OpenAI 竟然发布了 GPT-4。之前为大家介绍 ChatGPT 时就提到过它使用的是 GPT-3 的模型,而当时 OpenAI 的研发进度其实已经超过了 GPT-3,但是没想到 GPT-4 的发布会这么突然&…

互联网行业20年来最大机会:chatgpt part2

03.思考:当前机会在哪里 回顾历史,当我们看到 Google/iOS/Android 的时候,第一反应不应该赶紧抄一个 Google, 而是发现早期 Google 里面内容如此稀缺,应该做网站了。 看到 ChatGPT 以后,除了极少数公司&am…

17 个可以实现高效工作与在线赚钱的 AI 工具网站

编辑整理 | 杨小爱 自 2020 年以来,内容开发领域已经感受到人工智能工具的存在。 目前,营销人员和内容创作者正在利用这些工具来加快他们的工作流程。 如果您拥有最流行的 AI 工具之一,例如 CopyAI、Jasper AI 或 Content at Scale&#xff0…

简单的PHP脚本,可用于自动化创建网站

简单的PHP脚本&#xff0c;可用于自动化创建网站。请注意&#xff0c;这个脚本仅用于技术交流&#xff0c;禁止用于不道德及非法的目的&#xff1a; <?php // 设置基本参数 $base_url "https://www.example.com/"; // 填写您的基本URL $num_websites 10; // 指…

树莓派搭建网站,并免费内网穿透发布上线到公网

系列文章 树莓派搭建网站&#xff0c;并免费内网穿透发布上线到公网树莓派搭建WordPress网站&#xff0c;并内网穿透发布上线无需公网IP服务器为树莓派上的WordPress网站配置自己的域名&#xff0c;并内网穿透发布上线公网可访问SSH远程连接访问树莓派【无公网IP做内网穿透】为…

chatGPT批量生成器产出的文章能不能用做网站SEO优化

随着人工智能技术的迅猛发展&#xff0c;ChatGPT成为了内容创作者和营销人员的宝贵助手。那么&#xff0c;问题来了&#xff0c;这些由ChatGPT批量生成的文章能否成为网站SEO优化的利器呢&#xff1f;本文将深入探讨这个问题&#xff0c;并为你提供一些实用的技巧&#xff0c;帮…

使用ChatGPT的SEO技巧,为您的网站获得更多的搜索流量

在今天的数字时代&#xff0c;SEO&#xff08;搜索引擎优化&#xff09;成为网站成功的关键因素之一。优化网站内容以便被搜索引擎发现和评估&#xff0c;以及吸引更多的有意义的流量&#xff0c;是每个企业、组织或个人的最终目标。ChatGPT是一种在自然语言处理领域取得重大突…

玩 ChatGPT 的正确姿势「GitHub 热点速览 v.22.49」

作者&#xff1a;HelloGitHub-小鱼干 火了一周的 ChatGPT&#xff0c;HG 不允许还有小伙伴不知道这个东西是什么&#xff1f;简单来说就是&#xff0c;你可以让它扮演任何事物&#xff0c;据说已经有人用它开始了颜色文学创作。因为它太火了&#xff0c;所以&#xff0c;本周特…

【ChatGPT】 ChatGPT真會玩!網友提供的20種生活用法,不是做不到只是提示你想不到 | AI/大數據

現在仍然是 ChatGPT 的早期嘗試階段,對於企業來說,可能正試圖弄清楚人工智慧突然顛覆內容世界所帶來的法律和道德問題。然而,對於一般人來說,能將強大的人工智慧應用到日常任務中還是非常棒的。 除了翻譯、程式開發、問基本問題之外,你還會怎麼用它呢?外國網友在論壇上向…

《跟我学习AI量化投资》通过chatgpt进行选股,简单易懂,降低人为操作风险

打开chatgpt&#xff0c;向其提问题&#xff0c;内容如下&#xff1a; 写一个Python程序&#xff0c;能够统计最近一个月涨幅达到30%以上的股票在最近一个月前的市值、成交额、阳线数量、振幅和继续形态&#xff08;使用TA-Lib&#xff09;,请把每一个维度统计的方法和参数定义…

chatgpt赋能python:用Python来选股票:如何选择最佳的股票?

用Python来选股票&#xff1a;如何选择最佳的股票&#xff1f; 股票投资是一个非常棘手的事情&#xff0c;需要仔细地考虑众多因素&#xff0c;领悟公司的强项和弱点。最近&#xff0c;Python在数据科学和机器学习的领域变得非常流行&#xff0c;现在&#xff0c;人们使用Pyth…

chatgpt赋能python:Python短线选股技巧

Python短线选股技巧 随着人们对投资的认知逐步提升&#xff0c;越来越多的人开始关注短线投资&#xff0c;而在短线投资当中&#xff0c;选股是至关重要的一步。而Python作为一门功能强大且易于学习的编程语言&#xff0c;也可以用来帮助我们进行选股。 选股技巧一&#xff1…

【chatgpt We have detected suspicious login behavior and further attempts will be blocked. Please co】

一、定位问题 We have detected suspicious login behavior and further attempts will be blocked. Please contact the administrator 我们监测到可以的登录行为&#xff0c;进一步的尝试将被阻止&#xff0c;请联系管理员。 相信大家使用 chatgpt 时或多或少都会遇到这类问…