最新!OpenAI掌门人自曝GPU短缺,未来GPT-4会更快、更便宜

e78c7c7761cd8654c966764c62fef41a.gif

作者 | 金鹿     

本文经授权转自公众号腾讯科技(ID:qqtech),如需转载,请联系对方:

机器学习和人工智能初创公司Humanloop首席执行官拉扎·哈比比(Raza Habib),5月29日邀请OpenAI首席执行官萨姆·奥特曼(Sam Altman)以及其他20多位开发者,共同探讨了人工智能的未来。奥特曼非常坦率地分享了OpenAI未来两年的产品路线图,还谈到OpenAI的使命以及人工智能的社会影响等问题。

b60802796d5500909952ea08bb7849bc.jpeg

图源:Sam Altman个人博客

以下为访谈要点:

f6bbc00817627f701b17ec53eea3936a.png

OpenAI严重受制于GPU短缺

在整个讨论中出现的一个共同主题是,目前OpenAI的GPU供应非常有限,这导致他们推迟了许多短期计划。客户最大的抱怨是API的可靠性和速度。奥特曼承认存在这种担忧,并解释说大部分问题是因GPU短缺所致。

长度为32k的上下文功能还不能推广给更多的人。OpenAI还没有克服相关技术挑战,所以虽然看起来他们很快(今年)就会有100k到1M令牌的上下文窗口,但更大的窗口都需要在研究上取得突破。

微调API目前也受到GPU可用性的限制。它们还没有使用Adapters或LoRa等高效的调优方法,因此调优的运行和管理需要大量的计算。将来会有更好的微调支持。他们甚至可以托管一个社区贡献模型的市场。

专用容量供应受GPU可用性的限制。OpenAI也提供专用容量,为客户提供该模型的私人副本。但要使用这项服务,客户必须愿意支付相当于10万美元的费用。

037c8c4c0acdf3850dbb6e44e56ea105.png

OpenAI的近期路线图

奥特曼分享了他所看到的OpenAI API临时近期路线图。

2023年:

更便宜、更快的GPT-4:这是OpenAI的首要任务。总的来说,OpenAI的目标是尽可能地降低“智能成本”,因此他们将努力随着时间的推移继续降低API的成本。

更长的上下文窗口:在不久的将来,上下文窗口可能高达100万令牌。

微调API:微调API将扩展到最新的模型上,但其确切形式将由开发者真正想要的元素来决定。

支持会话状态的API:当你今天调用聊天API时,你必须反复地传递相同的会话历史,并反复支付同样的令牌。将来,会有一个版本的API可以记住会话历史记录。

2024年:

多模态:这在GPT-4发布时进行了演示,但在更多GPU上线之前不能扩展到所有人。

0a40394b1dbb05c67f0b93f245df2aa6.png

插件“没有PMF”,可能不会很快出现在API中

许多开发人员都对通过API访问ChatGPT插件感兴趣,但奥特曼说他认为这些插件不会很快发布。除了浏览,插件的使用表明他们还没有PMF。奥特曼表示,很多人认为他们希望自己的应用被集成到ChatGPT中,但实际上,他们真正想要的是将ChatGPT引入自己的应用中。

0a37bf78118ddef57fba7b36955bda48.png

OpenAI将避免与他们的客户竞争,除了ChatGPT

许多开发者表示,他们对使用OpenAI API构建产品感到紧张,因为OpenAI最终可能会发布与他们竞争的产品。对此,奥特曼表示,OpenAI不会发布更多ChatGPT之外的产品。他说,许多伟大的平台公司都有自己的杀手级应用,ChatGPT将允许他们通过成为自家产品的客户来改进API。ChatGPT的愿景是成为一个超级智能的工作助手,但还有很多其他的GPT用例是OpenAI无法触及的。

8d883bd2d190f508a813120c839565cb.png

监管是必要的,但开源同样重要

虽然奥特曼呼吁对未来的模型进行监管,但他并不认为现有的模型是危险的,认为监管或禁止它们将是一个大错误。奥特曼强调了开源的重要性,并表示OpenAI正在考虑开源GPT-3。他们还没有开源的部分原因在于,他怀疑有多少个人和公司有能力托管大语言模型。

24856ad8a55cbec35fe1cf442cc17b66.png

缩放定律仍然成立

最近许多文章都声称“巨型人工智能模型的时代已经结束”,但奥特曼表示,这并没有准确地表达他的意思。

OpenAI的内部数据表明,模型性能的缩放定律仍然成立,扩大模型将继续可以帮助提升性能。但这种扩展速度无法维持下去,因为OpenAI在短短几年内就把模型放大了数百万倍,这样做是不可持续的。不过,这并非意味着OpenAI将停止扩大模型,只是意味着它们的规模可能每年只会增加一倍或三倍,而不是以指数级速度增长。

缩放定律继续发挥作用的事实对通用人工智能(AGI)开发的时间线具有重要意义。缩放假设是指,我们可能已经具备了构建AGI所需的大部分要素,剩下的大部分工作将是采用现有方法,并将其扩展到更大的模型和更大的数据集上。如果缩放时代已经结束,那么我们应该期待AGI离我们更遥远。但事实上,缩放定律继续成立的事实强烈地暗示了时间线正变得更短。

2a243d6a5ab1f8dd6f6f891b1bc9e208.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/53254.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

汇正财经靠谱吗?大盘窄幅震荡

盘面回顾: 沪指全天窄幅震荡,大金融银行板块涨超1%,截止收盘沪指小涨0.07%;创业板全天低迷,锂电、光伏、风电等新能源方向领跌,新能源权重票下挫拖累创指,截止收盘创业板指跌1.39%。传媒、旅游…

2023年股票开户哪家手续费最低?融资融券利息率最低多少?万1融5!支持量化交易的券商

2023年融资融券费率最低是多少?利率5%,股票万一全佣,支持量化交易 股票开户费率参考: 1、股票佣金万1.2,最低万1(含规费),信用账户一致 2、场内基金(ETF、LOF)万0.6&…

谷歌的智能AI聊天机器人Bard已免费开放申请,赶紧加入等待列表体验一把

前言 2023年,真是一个Ai元年,随意ChatGPT的大火,各路网络巨头都按捺不住了,Google更是一度启动了红色警报,这是有史以来,谷歌感受到最大的压力,不过谷歌平时也并不是没有技术沉淀的&#xff0c…

如何快速看懂别人的代码

我们在写程式时,有不少时间都是在看别人的代码。 例如看小组的代码,看小组整合的守则,若一开始没规划怎么看, 就会“噜看噜苦(台语) ” 不管是参考也好,从开源抓下来研究也好,为…

直播平台源码中的推拉流是什么

关于直播平台源码中的推流和拉流,最常用的就是RTMP和RTSP协议了 推流,指的是把采集阶段封包好的内容传输到服务器的过程,推流是直播端需要完成的步骤。拉流是指服务器已有直播内容,用指定地址进行拉取的过程,拉流是客…

视频号直播怎么玩儿?手把手教你实操全流程!

目前,想要入局视频号直播带货的商家越来越多了,围绕视频号直播,功能也更加完善,但很多人还是依旧不知道如何入手,那新手如何做好一次视频号直播呢?有哪些注意事项? 这篇文章,你算是看…

如何做直播?企业微信直播和小程序直播2个工具够用了!

直播获客已成为2020年的趋势,便捷的直播工具不可或缺。企业微信直播和小程序直播免费、不用安装其他额外的APP、无需注册、获客能力强等特性成为商家直播的必备工具。 企业微信直播 可满足学校为学生提供线上远程教学的需求,同时企业也可以通过群直播进…

简单地实现文章的查重

最近想要做一个查重程序,目的是检测大学生提交的电子文档的重复率。 最初的想法是是参考之王的论文查重,但是发现他有自己的弊端,也就是说知网论文查重的算法能对标准的论文进行有效的查重。但是对于学生提交的电子档作业就不一定行了。 我…

开发者实战 | AI作画,OpenVINO™助你在英特尔GPU上随心创作

文章作者:武卓 最近,AIGC(即AI Generated Content,是指利用人工智能技术来生成内容)真的是火出了天际。除了被挤到服务器满负荷的 ChatGPT,另一个也颇受瞩目的领域当属 AI 作画了。利用开源的一类“扩散&am…

元宇宙已经秘不发丧了吗?

主笔/ 七公 文章架构师/ 花哥 出品/ 飞娱财经 还记得刚刚过去不久的2021年吗?这一年当时被称为“元宇宙元年”。回想“元宇宙元年”的辉煌,当时的热度犹在眼前。 这是一个几乎被所有人看好的赛道,各大公司招兵买马,一系列新部门被…

巴比特 | 元宇宙每日必读:百度副总裁、“希壤”负责人马杰离职,内部人士称百度转向AIGC,不愿向元宇宙业务投入更多资源...

摘要:据界面新闻报道,百度副总裁、百度“希壤”业务负责人马杰已经于近期离职,希壤团队虽并未解散,但前途目前并不明朗,部分人员已经转岗或离职。内部相关人士表示,元宇宙业务短期内难以看到好的商业模式&a…

比Python快3.5万倍的语言来了/ 微软将推私有版ChatGPT/ iOS17剧透8项新功能…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,长假归来,今天是5月4日星期几来着? 今日科技圈更多新鲜事儿,一起来看。 编译器大佬发明全新编程语言Mojo AI基础设施公司Modular AI发布了一门全新的编程语言Mojo。 它专为AI领域…

王三金的电影清单

待看清单> 中国:一个世纪的革命 公民凯恩 卡萨布兰卡 力争上游 决胜21点 中邪 昆池岩 灵动:鬼影实录 推手——8.4 喜宴——8.9 饮食男女——9.1 烈日灼心——8.1 七月与安生——7.6 路边野餐——7.9 过春天——7.7 大象席地而坐——8.1 吉祥如意…

Windows+vscode+clang配置后写程序后提示file not found找不到头文件的解决办法

我是安装谭九鼎: https://www.zhihu.com/question/30315894的方法配置的,结果写测试程序的时候提示找不到头文件 如下: 在网上找了好多方法都没有解决,回过头仔细看他的配置方法,有这么一句: 仔细一看我的好像就是打开…

论文阅读:Cutting the Cord in Virtual Reality

论文名字 Cutting the Cord in Virtual Reality 来源 会议 年份 2016.11 作者 Omid Abari, Dinesh Bharadia, Austin Duffield, Dina Katabi 核心点 提出一个可配置的毫米波反射器 阅读日期 2020.9.21 内容总结 文章主要解决的问题及解决方案: 问题&am…

论文阅读:One-Shot Video Object Segmentation

论文名字 One-Shot Video Object Segmentation 来源 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 年份 2017.4.13 作者 S. Caelles K.-K. Maninis J. Pont-Tuset L. Leal-Taix D. Cremers L. V an Gool ETH Zrich TU Mnchen 核心点 提出…

vs2022调试配置文件不存在的解决方案

代码就是最基础的Hello,World using System; namespace _001 { class Program { static void Main(String[] args) { Console.WriteLine("Hello,World!"); } } } 如图,已经百度了几种方法&…

go私有库封装到gitlab/github

一、说明 go语言拥有自己的库管理工具,如果使用本地clone也是可以的,但如果库很多的话,管理起来十分麻烦,所以需要使用go内部的mod进行管理。 二、代码 1.撰写代码: //输入网址 export GOPRIVATEgitee.com分别执行…

《CryptDB: Protecting Confidentiality with Encrypted Query Processing》论文学习笔记

文章目录 CryptDB: Protecting Confidentiality with Encrypted Query Processing1.cryptDB概述(背景)2.CryptDB方案①面对威胁1☆大致系统框架☆SQL-aware Encryption☆Adjustable Query-based Encryption☆其他DBMS功能 ②面对威胁2☆向共享数据提供访…

论文阅读:Deep Leakage From Gradients

论文名字 Deep Leakage From Gradients 来源 顶会 NeurIPS 年份 2019.12 作者 Ligeng Zhu Zhijian Liu Song Han 核心点 主要研究梯度泄露问题,使用比以往方法更强的攻击方法,恢复图像是像素级的,恢复文本是符号级的匹配。提出有效…