马斯克宣布打造 ChatGPT 竞品!OpenAI CEO 给他泼了一盆冷水,GPT-5 或将大变

无脑增加

模型规模

已经落伍

当你在 ChatGPT 或者新 bing 里输入一个问题,AI 会调用它的云端大脑,思索一番,生成一段较为合理的回答。

而在 OpenAI 开发 GPT 时,也反复提到了参数正变得庞大,模型的规模也在逐代变得复杂。

训练大规模的语言模型,需要极大算力的 GPU 集群,并且随着用户数量的指数级增长,运行它们同样会占用相当的算力。

每个想要入局 AIGC 的企业,最先考虑的是如何布局大规模的云计算中心,仿佛 AIGC 的竞争已然成为硬件资源的角力。

OpenAI CEO Sam Altman  图片来自:wired

有了更强算力的计算中心,就能够跑得起更大规模的语言模型和算法,最终的 AI 产品,可能也会变得更「聪明」。

然而,近期 OpenAI CEO Sam Altman 在麻省理工的演讲里,给那些想凭借「大力出奇迹」的后来者泼了盆冷水。

Altman:无脑扩大模型规模已经过时

「大型模型时代已经到头了,我们需要用新的思路和方法,让 AIGC 取得新的进展。」

扩大模型规模,利用更复杂的参数,调用更大的算力,基本上是 OpenAI 过去几年在 GPT 上所使用的迭代方法。

GPT-2 大概拥有 15 亿参数,而 GPT-3 则拥有 1750 亿参数,而 GPT-4 虽然没有官方数字验证,但不少机构也推测出,它使用了数万亿字的文本和上万台云计算服务器,训练它的成本已经超过了 1 亿美元。

随着 ChatGPT 的影响力越来越大,微软也使用了其底层技术,推出了新 bing。

随之,Google 推出了 Bard,Adobe 推出了 Firefly,除了这些大企业外,硅谷许多资金充裕的初创企业,像是 Anthropic、AI21、Cohere 和 Character.AI,也在疯狂地投入,构建更大规模的算法,以赶上 ChatGPT 和 OpenAI。

二代 Runway 一句话生成的大片

对于硬件资源的极大需求,也造成了英伟达 A100、H100 GPU 的抢购潮。

在 eBay 上,英伟达的 H100 已经成热门商品,价格更是炒到了 4 万美元,而其官方售价只是 3.3 万美元。并且,H100 一般是打包 8 张组成一个服务器销售。

目前,并没有其他的第三方对外销售的 GPU 与英伟达竞争,在 AI 浪潮之下,谁的英伟达 GPU 越多,仿佛就掌握了 AIGC 行业的取胜之匙。

与传统行业的资本垄断、大企业垄断类似,对于算力的追求,也催生了「算力垄断」。

而 Sam Altman 也表示,OpenAI 还没有开发 GPT-5 的计划。言下之意便是,无脑的扩大模型规模,并不会让 GPT 保持无限的迭代。

目前来说,ChatGPT 与微软的新 bing 都遇到了不少因为算力不太够而出现宕机、服务不稳定的状况。

同时,新 bing 也并未面向所有用户,「排队等待」的状况仍然存在。

而这也是 Google 还无法将类似的生成式 AI 完全引入其搜索的一个原因。

曾在 Google 从事 AI 工作,现在是 Cohere 创始人的 Nick Frosst 也表示 Altman 很有先见之明,并且也表示,新的人工智能模型设计或架构可能会基于人类反馈进行调整。

按照这个思路来说,OpenAI 或许已经在用新的思路在构思 GPT-5 了。

Musk:挖人、买显卡、组团队入局

即便 Sam Altman 公开表示,现阶段继续走 OpenAI 的老路,通过扩大模型规模来提升,很难追得上 ChatGPT。

但曾是 Altman 的老朋友 Musk,毅然决然地投入到了 AIGC 行业之中。

根据华尔街日报的消息,Musk 悄悄地注册了一家名为 X.AI Crop 的公司,并从 Google 挖了几名研究员,向英伟达买了几千张显卡。

Musk 的目的很明确,就是为了与 OpenAI 和 Google 展开竞争。

就在相关报道发出之后,Musk 在接受 Fox News 采访时,就承认了想要推出一款类似 ChatGPT 的产品,取名为 TruthGPT。

Musk 的意图很明确,TruthGPT 将会「最大化寻求真理的 AI」,并试图理解宇宙的本质,希望能带来更多的好处而不是坏处。

Musk 的采访和回应,其实有点无厘头,毕竟按照现在大语言模型的规模来看,X.AI Crop 可能还不如硅谷的一些初创团队。

且 TruthGPT 这个名字也像是在向 ChatGPT 抗议。

Musk 一直认为 GPT-4 类的生成式 AI 会有相当大的风险,呼吁暂停开发六个月,并且呼吁推出相应的监管。

甚至也说出了「ta 有毁灭文明的潜力」。

只是一边说暂停研究,自己一边成立 X.AI Crop 开始入局 AIGC,很难不相信这是在炒作。

另外,暂停六个月的研发,也更像是封印 OpenAI,给自己留出六个月的时间来迎头追上进度。

不可否认地说,Musk 的 SpaceX、Tesla 都颠覆了一个行业,成为当下名气最响亮的企业。

Musk 与 Starship

而当初离开 OpenAI,看到如今的成就,并用一些比较有争议的言论,反而展示了 Musk 早就错失机会的不甘。

至于 TruthGPT 是否能像他说的那样,只能等六个月再看看了。

黄仁勋:我们需要一个 App

目前生成式 AI 仅存在于对话框中,以一种很古典的形式出现在当下所有的智能设备当中。

不论是插件,还是第三方 App,最终大众与其交互的都是一个个对话文本框。

这也是计算机刚刚出现时,最初级的人机交互方式。

而在 Nicolai Tangen 的一期播客里,他与英伟达 CEO 黄仁勋 畅聊了 AI 将会如何改变人们生活和工作方式。

当下 AI 的快速发展,离不开英伟达的 GPU 的助力,英伟达几乎垄断了云算力的市场。

如 Altman 的观点,当下 AI 还无法摆脱超高算力,超大型模型以及庞大算法的支持。

对于初创公司来说,这是一个挑战,而对于英伟达来说也是。

英伟达需要不断地开发制造更强大的 GPU 来适应 AI 的发展。并且目前 AI 仍然存在于巨大的数据中心,以及需要多台超级计算机提供算力。

它不像此前任何的一个应用程序,或者软件。GPT-3 有着 1750 亿个参数,在面对如此的计算量时,英伟达的 AI GPU 从底层重新进行了设计。

但目前,处理大规模的数据和学习大模型,仍然需要数周的时间。它现在还无法浓缩到一个 App 或者个人 PC 当中。

如此其实也解答了到目前为止 AI 对于软件的促进,其实都是以云和插件的形式存在。

而英伟达也表示,AI 已经开始深入到自己芯片的设计当中,「当芯片架构师在睡觉的时候,AI 仍然在不断地迭代和优化改进相应架构」。

「它能帮助我们更好地设计和制造芯片。」

换句话说,AI 介入芯片的生产,而生产出的芯片又用于云算力来运行 AI,这算是 AI 的自给自足了吧。

另外,黄仁勋也认为 AI 也将会引发下一次工业革命,它暂时不会自我觉醒取代人类。

反而会极大地解放人力,增加每个人的生产力。人们可以利用自然语言直接编程,而无需学习复杂的 Python、Java、C 语言。

并且,他也拿英伟达的软件工程师举例,在 AI 的帮助下,大概有 40~50% 的代码和软件由生成式 AI 补充,工程师只要提供建议与思路。

黄仁勋也预估,AI 的加入,会让目前英伟达软件工程师的生产效率提升 10 倍。

Github 的 Copilot 功能

AI 的介入,能够让人们以一万倍的速度完成很多繁琐的事情,间接提高了生产力。

在 GPT-4 出现之前,AI 行业可以以简单地依靠扩大模型规模,增加硬件部署来保持高速迭代。

随着算力瓶颈的出现,不得不让 OpenAI 重新思考如何优化,找到 AI 的下一步发展方向。

同样地,黄仁勋也清晰地认识到,目前 AI 对于算力的需求过于庞大,且它需要存在于一个空间巨大、芯片众多的位置,现在的 AI 就仿佛像是世界上第一代计算机 ENIAC 一般。

AI 的下一步,减少对资源需求的同时,也需要瘦身,并且能独立存在于一个 App 或者软件当中。

从目前来说,这还不太现实,不过好消息是 OpenAI 已经开始招聘 Android、iOS 工程师,相应的 App 也应该很快就来了。

ChatGPT 们难以复制的原因,除了耗显卡,还有水电费太贵?

ChatGPT 之父承认 GPT-5 并不存在,为什么 OpenAI 总是这么实诚?|万字详述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22854.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

死磕数据库系列(二十六):MySQL 高可用之单主、双主模型组复制配置实践

点关注公众号,回复“1024”获取2TB学习资源! 前面我们学习:MySQL 高可用之组复制(MGR)技术的相关原理知识,今天我将详细的为大家介绍 MySQL 高可用技术组复制的单主、双主两种模型下的原理及配置相关知识&a…

chatgpt赋能python:Python中三角函数的使用

Python中三角函数的使用 介绍 Python是一种非常流行的编程语言,因为它非常易于学习和使用。Python中有很多实用的库和模块,可以帮助开发人员更轻松地完成各种任务。其中包括Python的数学库,其中包括三角函数。 三角函数是最基本的数学函数…

断网了,还能ping通 127.0.0.1 吗?[localhost与127.0.0.1区别]

1.应用场景 主要用于学习了解localhost 与 127.0.0.1的区别, 本质. 以及计算机关于本机地址是如何工作的。 为什么要有这个地址。 2.学习/操作 1.文档阅读 断网了,还能ping通 127.0.0.1 吗? 开发环境- 配置虚拟主机域名/hosts文件 2.整理输…

反调试与反反调试

参考文本 (190条消息) C 反反调试(NtQueryInformationProcess)_(-: LYSM :-)的博客-CSDN博客 Windows 平台反调试相关的技术方法总结—part 2 - 先知社区 C/C MinHook 库的使用技巧 - lyshark - 博客园 (cnblogs.com) (177条消息) C 反反调试&#x…

哈工大2023春计算机系统大作业:程序人生-Hello‘s P2P

摘要:以hello.c程序为例,文章探究了从C语言代码文件到进程回收这一过程。基于Linux操作系统,运用gcc,edb等工具,详细介绍了程序编译的流程,分析了运行可执行文件时系统的进程管理与存储管理原理与机制&…

Transformer模型的基础演算

作者 | Quentin Anthony、Stella Biderman、Hailey Schoelkopf OneFlow编译 翻译 | 贾川、徐佳渝、杨婷 1 引言 Transformer语言模型的许多基本重要信息可以通过简单计算得出。不幸的是,这些计算公式在自然语言处理(NLP)社区中并不广为人知。…

DetectGPT:使用概率曲率的零样本机器生成文本检测

DetectGPT的目的是确定一段文本是否由特定的llm生成,例如GPT-3。为了对段落 x 进行分类,DetectGPT 首先使用通用的预训练模型(例如 T5)对段落 ~xi 生成较小的扰动。然后DetectGPT将原始样本x的对数概率与每个扰动样本~xi进行比较。…

Prompt工程探索

在开源大模型LLaMA等成熟后,目前业界焦点在于:如何才能让 LLM 按照我们的要求去做,也就是prompt工程,设计产生大量prompt训练语料用于微调大模型 设计原则 首先要说的是设计原则,主要包含以下几个: 清晰…

如何使用 ChatGPT 将任何数据格式导入 MySQL

ChatGPT 是 OpenAI 开发的强大语言模型,在各个领域都有广泛的应用,包括数据库开发。在本文中,我们将演示开发人员、DBA 和数据分析师如何利用 ChatGPT 的功能来增强向 MySQL 等数据库的数据导入。 如今,跨不同系统和格式的数据迁…

ChatGPT爆炸级更新,可以联网、使用插件进行交互

在几个月内ChatGPT一直处于科技热点的中心,并且放出了一个又一个大招,如GPT-4、深度融合进Office等等。前两天再次放出爆炸级更新--ChatGPT Plugins,让ChatGPT的躯体再次得到完善。 OpenAI将插件类比为ChatGPT的“眼睛和耳朵”,使…

ChatGPT王炸更新,插件系统上线!

Datawhale干货 最新:ChatGPT应用,来源:KiddoAI 文章编辑:Datawhale 这是一个"App Store"时刻 OpenAI今天宣布支持ChatGPT的新第三方插件,这个在网络上被热议的消息成真了!这相当于苹果的App Sto…

chatgpt赋能python:使用Python制作动画的步骤和工具

使用Python制作动画的步骤和工具 Python不仅是一种流行的编程语言,还可以用于制作动画。本文将介绍一些基本步骤和工具,帮助你制作出精美的动画作品。 步骤一:选择一个好的动画框架 Python有很多强大的动画框架可以使用。其中一些最受欢迎…

chatgpt赋能python:Python动画引擎:如何实现流畅的动画效果?

Python动画引擎:如何实现流畅的动画效果? Python动画引擎是一个强大的工具,可以帮助开发人员快速创建出令人惊叹的动画效果。它可以用于制作游戏、建筑模拟、数据可视化等场景中,为用户带来更好的交互体验。在这篇文章中&#xf…

chatgpt赋能Python-python_chia

简介:什么是Python Chia? Python Chia是一种加密货币,它的挖矿过程使用Python编程语言。Python Chia是开源的,任何人都可以参与挖矿。 Chia使用绿色挖矿的方式,这意味着Chia的挖矿过程对环境没有任何负面影响。此外&…

美赛C题纪实

提示:这篇是美赛结束发的!!!!!!!没有作弊,没有参考任何网上思路!!!!!仅为自己记录教训和为他人提供代码案例 文…

让ChatGPT做我的Java老师,他会怎么教我学习Java呢?

最近ChatGPT挺火的,突然想到一个有趣的玩法,ChatGPT如果来当老师,他会怎么教我学习java语言呢? 首先来看看ChatGPT认为熟练掌握java语言需要多长时间呢? ChatGPT认为熟练掌握java语言需要3-6个月。那我们就让他给我一份…

基于Android的应用市场软件的设计

基于Android的应用市场软件的设计 摘  要 随着智能手机的普及,人们越来越依赖手机进行一系列操作。 由于Android系统是一款免费的操作系统,导致了使用Android系统的手机占到7成左右。为了让Android手机用户体验更好,就需要让Android手机用户…

实际案例演示:从理论到实践,如何落地应用设计模式

大家在学习设计模式应该都会有个疑问,学完了。到底项目上怎么来用呢,好像没有思路。如果你也有这个疑问可以试试用chatgpt辅助你。不仅给了说明,还会给你提供代码demo,可以打开自己的思路。 以下就是详细的结果: 在开发Java版电子…

清华ACL 2023最新长文 | WebCPM:首个联网支持中文问答开源模型

2021年12月 WebGPT 的横空出世标志了基于网页搜索的问答新范式的诞生,在此之后,New Bing 首先将网页搜索功能整合发布,随后 OpenAI 也发布了支持联网的插件 ChatGPT Plugins。大模型在联网功能的加持下,回答问题的实时性和准确性都…

忆享聚焦|人工智能、元宇宙、云计算、5G基站…近期热点资讯一览

“忆享聚焦”栏目第十二期来啦!本栏目汇集近期互联网最新资讯,聚焦前沿科技,关注行业发展动态,筛选高质量讯息,拓宽用户视野,让您以最低的时间成本获取最有价值的行业资讯。 目录 行业资讯 1.ChatGPT火爆全…