OpenAI 总裁:GPT-4 有不完美,高阶版本正在测试!

01f50cf2f8d8fce796297eada36bd250.gif

【CSDN 编者按】OpenAI 总裁格雷格・布罗克曼:GPT-4 并不完美但绝对与众不同。

原文链接:https://techcrunch.com/2023/03/15/interview-with-openais-greg-brockman-gpt-4-isnt-perfect-but-neither-are-you/

未经允许,禁止转载!

整理 | 王子彧

出品 | CSDN(ID:CSDNnews)

3月15日,继 ChatGPT 展现了惊人的实力之后,OpenAI 又扔下了一颗核弹:备受期待的史上最强人工智能大模型 GPT-4 发布了。

据 TechCrunch 消息,OpenAI 联合创始人兼总裁格雷格・布罗克曼在接受记者凯尔·威格斯采访时表示,GPT-4 并不完美但绝对与众不同,并且他还在采访中透露,OpenAI 正在测试 GPT-4 高级版本,是普通 GPT-4 储存内容能力的 5 倍。本文对这篇采访进行了编译,以飨读者。

3a596446a9a012121eb0e5e5e30f04df.png

关键改进:多模态能力

GPT-4 在其前身 GPT-3 的基础上,对很多方面做了关键性的改进。例如提供了更多真实的声明,并允许开发者更容易设计其风格和行为。同时,GPT-4 也是多模态的,它可以可以接受图像作为输入并生成标题、分类和分析。

但 GPT-4 也有局限性。和 GPT-3 一样,该模型对事实产生了 "幻觉",并出现了基本的推理错误。OpenAI 在自己的博客上举了个例子, GPT-4 将“猫王”埃尔维斯・普雷斯利(Elvis Presley)描述为 "一个演员的儿子",但事实是他的父母都不是演员。

当被问及如何比较 GPT-4 和 GPT-3 时,格雷格・布罗克曼说了一个词:与众不同。他解释到:“尽管 GPT-4 还存在很多问题和错误,但绝对与众不同,你可以看到其在微积分或法律等技能方面的提升。虽然它曾在某些领域表现很糟糕,但现在已经达到超越常人的水准。”

测试结果验证了格雷格・布罗克曼的观点。在高考微积分考试中,GPT-4 得了 4 分, GPT-3 得了 1 分,而介于 GPT-3 和 GPT-4 之间的中间模型 GPT-3.5,得了 4 分。

在分析 GPT-4 的能力时,OpenAI 还让该模型参加了统一律师考试、法学院入学考试(LSAT)、研究生入学考试(GRE)的定量、口头推理、分析写作考试以及和各种 AP 科目考试等测试。结果显示,GPT-4 在大多数这些专业和学术考试中表现与人类水平相当。这意味着,如果 GPT-4 是一个仅凭应试能力来判断的人,它可以进入法学院,而且很可能也能进入许多大学。

889925f44f39720ee331e1e5637c77dd.png

eb33fccef6bce15b13ab6c65e463ed5b.png

不仅如此,GPT-4 更受人关注的是上面提到的多模态。GPT-3 和 GPT-3.5 只能接受文本提示(例如 "写一篇关于长颈鹿的文章"),而 GPT-4 可以同时接受图片和文本的提示来完成一些动作(例如识别在塞伦盖蒂拍摄的长颈鹿图像,并给出基本的内容描述。)

这是因为 GPT-4 是在图像和文本数据上训练的,而它的前身只在文本上训练。OpenAI 说,训练数据来自 "各种合法授权的、公开可用的数据源,其中可能包括公开可用的个人信息",但当被问具体细节时,格雷格・布罗克曼避而不谈。(训练数据曾使 OpenAI 陷入法律纠纷)。

101f7bcb5909d62da6fdaa37266bb25e.png

超强优势:图像理解能力

GPT-4 有超强的图像理解能力。例如,输入提示“这张图片有什么好笑的?GPT-4 会将整张图片分解,并正确地解释了这个笑话的笑点。

目前,只有一个合作伙伴可以使用 GPT-4 的图像分析功能,一个名为 Be My Eyes 的视力障碍者的辅助应用程序。布罗克曼说,在 OpenAI 评估风险和利弊的过程中,无论何时,更广泛的推广都将是“缓慢而有意的”。他还认为,"有一些政策问题我们需要解决,如面部识别和如何对待人的图像。我们需要弄清楚危险区在哪里,红线在哪里,再随着时间的推移找到答案。"

OpenAI 在其文本到图像转换系统 Dall-E 2 上也遇到了类似伦理困境。在最初禁用该功能后,OpenAI 允许客户上传人脸,用 AI 驱动的图像生成系统对其进行编辑。当时,OpenAI 声称,其安全系统的升级使面部编辑功能成为可能,因为它将深度造假以及试图创建性、政治和暴力内容的潜在危害降到最低。

另一个长期问题是防止 GPT-4 在无意中被用于可能造成伤害的方式使用。在该模型发布几小时后,以色列网络安全初创公司 Adversa AI 发布了一篇博客,演示了绕过 OpenAI 的内容过滤器并让 GPT-4 生成钓鱼电子邮件、对同性恋者的攻击性描述以及其他令人反感文本的方法。

在语言模型领域,这并不罕见。Facebook 母公司 Meta 的聊天机器人 BlenderBot 和 OpenAI 的 ChatGPT 也曾被诱惑输出不恰当的内容,甚至透露了其内部工作的敏感细节。但包括记者在内的许多人都希望,GPT-4 可能会在这方面带来重大改进。

当被问及 GPT-4 的稳健性时,布罗克曼强调,该模型已经通过六个月的安全培训。在内部测试中,与 GPT-3.5 相比,它对 OpenAI 的使用政策不允许的内容请求的回应率降低了 82%,对 "事实 "的回应率提高了 40% 。

布罗克曼说:"我们花了很多时间试图了解 GPT-4 的能力,我们不断地进行更新,包括不断改进,这样模型就更有扩展性,以达到人们希望它拥有的任何个性或模式。"

7634f7ed6e0cf7a6c39d7109b2317fd7.png

不足之处

坦率地说,早期的现实测试结果并不是那么让人满意。除了 Adversa AI 测试之外,微软的聊天机器人 Bing Chat 也被证明非常容易受到越狱影响。使用精心设计的输入,用户能够让该聊天机器人表达爱意,发出威胁伤害,为大屠杀辩护和编造阴谋论。

布罗克曼并不否认 GPT-4 在这方面的不足,但他强调了该模型的缓解性转向工具,包括被称为“系统”消息的 API 级功能。系统消息本质上是为 GPT-4 的交互设定基调并建立界限的指令。例如,一条系统消息可能是这样写的:“你是一位总是以苏格拉底风格回答问题的导师。你永远不会给学生答案,而是总是试着提出正确的问题,帮助他们学会独立思考。”

我们的想法是,系统消息充当护栏,防止 GPT-4 偏离轨道。布罗克曼说:“真正弄清楚 GPT-4 的语气、风格和本质一直是我们关注的焦点。我认为我们开始更多地了解如何进行工程设计,了解如何拥有一个可重复的过程,让你得到对人们真正有用的可预测结果。”

布罗克曼还提到了 Evals,这是 OpenAI 最新的开源软件框架,用于评估其 AI 模型的性能,这是 OpenAI 致力于“增强”其模型的一个标志。Evals 允许用户开发和运行评估 GPT-4 等模型 的基准测试,同时检查其性能,这是一种众包的模型测试方法。

布罗克曼说:“通过 Evals,我们可以更好地看到用户关心的用例,并可以对其进行测试。我们之所以开源这个框架原因之一是我们不再每隔三个月发布一个新模型以不断改进。你不会制造你不能测量的东西,对吧?当我们推出新版模型,我们至少可以知道发生了哪些变化。”

布罗克曼还被问道,OpenAI 是否会补偿人们用 Evals 测试其模型?他不肯承诺,但他确实指出,在有限的时间内,OpenAI 允许选定的 Eevals 用户提前访问 GPT-4 API。

d92372bdc5e90f5c6b5c758c5f5838e5.png

关于未来:GPT-4 的另一个版本

布罗克曼的谈话还谈到了 GPT-4 的上下文窗口,指的是模型在生成其他文本之前可以考虑的文本。OpenAI 正在测试 GPT-4 的另一个版本,它可以 "记住 "大约 50 页的内容,是普通的 GPT-4 所能容纳内容的 5 倍,是 GPT-3 的八倍。

布罗克曼认为,扩大的上下文窗口会带来新的、以前没有探索过的应用,特别是在企业中。他设想了一个为公司打造的 AI 聊天机器人,利用来自不同来源的各部门的员工的背景和知识,以一种非常明智但具有对话性的方式回答问题。

这不是一个新概念。但布罗克曼提出的理由是,GPT-4 的答案将比今天的聊天机器人和搜索引擎的答案有用得多。他说:“以前,模型根本不知道你是谁,你对什么感兴趣等。而有了更大的上下文窗口肯定会让它的能力变强,从而更好的为人们提供服务支持。”

7d57197e09b9dc76d2ef8159f1de8ecb.gif

 
☞万万没想到|2023 智能大屏创意征集赛再启航!
☞谷歌反击战!开放大语言模型 PaLM API,让 AI 帮你“打工”
☞多模型大模型 GPT4 发布:看得懂梗图,考得上律师

5a67ab54b0b1b7807daaefe9cc6c0e97.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23733.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

美团创始高管离职创业/ 国内首个类ChatGPT下月开源/ 推特员工睡公司仍被裁 ...今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 新的一周又开始啦~ 在这段万物复苏、ChatGPT四处轰炸的日子里,科技圈又有哪些好玩的新鲜事? 日报君在此呈上。 OpenAI CEO提出新摩尔定律 ChatGPT红红火火,OpenAI CEO Sam Altman顺势提…

「B站焊武帝」再出圈!孤身爆肝造CPU,软硬件全自研,可玩游戏,基础器件成本不到1000元...

杨净 Pine 发自 凹非寺量子位 | 公众号 QbitAI 两年时间,一个90后体制内小哥下班之后只干三件私务,那就是: 手搓CPU!手搓CPU!还是***手搓CPU! 纯手工制作、全自主研发,于是一个名叫“初芯”的CP…

新中国第一位博士!答辩导师团豪华到令人害怕

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【Transformer】微信技术交流群 本文转载自:募格学术 | 来源:新教育100人 他,新中国培养的第一位博士,获得001号博士学位证书&…

课题组亓林博士的论文被 IEEE TGRS 录用

课题组亓林博士的论文 “SSCU-Net: Spatial-Spectral Collaborative Unmixing Network for Hyperspectral Images” 被遥感领域顶级期刊IEEE Transactions on Geoscience and Remote Sensing 录用。 线性高光谱解混是高光谱图像处理和解译中的一项重要技术。近年来,…

复旦大学苏教授火了!扯出600多个假博士

上一篇:为什么程序员每到一家新公司干了两三年,都有一种干不下去的感觉? 华为,否认了与陈春花的关系。网友,揭穿了陈春花的假学历。北大,解除了陈春花的聘任合同。陈春花,扯出了复旦首席教授苏东…

SIGGRAPH最佳博士论文奖又落华人手中,胡渊鸣的这位师兄不一般

白交 发自 凹非寺 量子位 报道 | 公众号 QbitAI 谁能想得到?SIGGRAPH最佳博士论文奖,又被「华人学者」纳入囊中。 这已经是「连续3年」,该重要奖项颁给华人学者,此前分别由加州大学伯克利分校闫令琪博士和朱俊彦博士摘得。 而最近…

26岁的他,任中国科大特任教授!2年前已在美国顶尖大学担任博士生导师!

点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 来源:澎湃新闻 编辑:双一流高校 1994年出生,今年26岁的威斯康星大学麦迪逊分校原助理教授陈杲,已加盟中国科学技术大学几何与物理研究中心,任特任教…

【记录】关于知乎“国外博士的能力真的比国内博士强吗”的讨论

曾经在知乎关注了一个帖子,国外博士的能力真的比国内博士强吗? 因为有段日子没刷知乎了,今天打开一看,多了很多回答。 有一些回答肯定了本土博士的科研水平。比如: 反对小马过河回答:用上课来区分国内外博…

热搜第一!他 21 个月获清华博士学位,曾击败 NASA 夺冠,还发了 27 篇 SCI 论文

“用时 1 年 9 个月取得清华博士学位”、“以一作身份发表 SCI 论文 27 篇”、“在大赛中曾击败 NASA”……这些经历,单拎一条出来都足以令人艳羡不已,如今却全部聚集到了一个人身上——他就是姜宇,西安卫星测控中心极端轨道力学与应用科技创…

图灵奖得主Lecun、纽约大学教授Marcus,大佬争论背后的玄机

整理 | 杨阳 出品 | CSDN(ID:CSDNnews) 四年前,纽约大学教授Marcus为反驳深度学习三巨头之一Bengio的“有意识先验”和“解纠缠观念”理论,发表了一篇名为《Deep Learning: A Critical Appraisal》的论文,长…

为什么我感觉国内博士毕业手里的paper普遍比国外博士多?

链接:https://www.zhihu.com/question/457963341 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删 作者:匿名用户https://www.zhihu.com/question/457963341/answer/1877675388 给大家举一个例子:不是国…

斯坦福校长被曝学术不端,正接受校方调查!11篇论文「篡改图片」涉嫌造假

【导读】学术打假专业户Elisabeth Bik盯上了斯坦福大学校长Tessier-Lavigne,指其1999年以来发在Science、Nature和Cell等顶刊的多篇论文涉嫌「篡改图片」的学术不端行为,校方已正式展开调查。 || 斯坦福大学调查自己校长学术不端? 近日&…

2022年「百强AI论文」出炉:清华紧随谷歌排名第二,宁波工程学院成最大黑马

【导读】谷歌仍然全球领先,OpenAI每两篇论文就有一篇进百大! 人工智能领域的创新步伐越来越快,论文数量也呈爆炸式增长,甚至达到了人力无法阅读的程度。 在2022年发表的海量论文中,哪些机构的影响力最大&#xff1f…

【深度学习】GPT系列模型:语言理解能力的革新

GPT-1🏡 自然语言理解包括一系列不同的任务,例如文本蕴涵、问答、语义相似度评估和文档分类。尽管大量的未标记文本语料库很充足,但用于学习这些特定任务的标记数据却很稀缺,使得判别式训练模型难以达到良好的表现。我们证明&…

九龙证券|又一股爆雷或退市!周末影响一周市场的十大消息

1、利空突袭!4600亿芯片巨头崩了,监管重磅反击 3月31日晚间,据我国网信网,为保证要害信息基础设施供应链安全,防备产品问题危险造成网络安全危险,维护国家安全,网络安全检查办公室按照《网络安全…

可视化和回归分析星巴克咖啡在中国的定价建议

可视化和回归分析星巴克咖啡在中国的定价建议。星巴克的拿铁大杯Tall 在各国的价格。 Claude AI | 代码自动生成的数据可视化代码 选择Claude AI 而非 ChatGPT的理由是前者更懂中文​!具体可以参见我前面的两篇文章对比两者的中英文翻译的表现及使用安装等难易程度​…

定一个小目标,先赚他1个亿(ChatGPT可能要替代你的工作了)

相关历史文章 神奇的荷尔蒙 —— 我滴个神 自律到变态的人,人生就像开了挂 人生,就是一个不断选择的过程 人生如果没有目标,跟咸鱼有什么分别 掌控情绪方能掌控人生 你把时间投资在哪里,哪里就会有成就,你是你这…

人工智能实践——Restauraut+ 食物识别分析与营养规划系统

项目背景描述: 项目以落地性强、准确度高为主要宗旨。对于餐厅而言。目前,由于使用收银机,餐厅的付款流程仍然是人工的且效率低下的。收银员会检查顾客点了什么食物,然后在收银台上进行结算。效率并不高。因此,食物识别…

揭示大型语言模型的力量、挑战和影响

目录 揭示大型语言模型的力量、挑战和影响

【教学类-36-01】20230623 Midjounery生成的四张图片切片成四张小图

作品展示: 把一张正方形图片的四个等大小图切割成四张图片 背景需求 最近在学习ChatGPT的绘画(midjounery AI艺术) 我想给中班孩子找卡通动物图片(黑白线条),打印下来,孩子们练习描边、涂色…