史上最强模型 GPT-4 上线:一张手绘草图能生一个网站、60 秒搞定一个游戏开发!...

93c60e946e269cb2c1f91f28014a34da.gif

整理 | 苏宓

出品 | CSDN(ID:CSDNnews)

平地一声雷,GPT-4 重磅来袭。

3 月 14 日,OpenAI 正式上线新一代人工智能大模型 GPT-4,它是一个大型多模态模型,可以接受图像和文本输入,同时返回文本输出。就像这样:

用户:这幅画有什么好笑的地方?逐一描述它的板块。

5bdfb997d10b26c5ea781cf26fb94bae.png

图片来源:https://www.reddit.com/r/hmmm/comments/ubab5v/hmmm/

GPT-4:图片显示的是一个 "Lightning Cable "适配器的包装,有三个板块:

板块1:一部智能手机,VGA 连接器(通常用于电脑显示器的大型蓝色 15 针连接器)插在其充电端口。

板块2:"Lightning Cable "适配器的包装上有一张 VGA 接口的图片。

板块3:VGA 连接器的特写,末端是一个小的 Lightning 连接器(用于为 iPhone 和其他苹果设备充电)。

这张图片的幽默感来自于将一个大的、过时的 VGA 连接器插入一个小的、现代的智能手机充电端口的荒谬性。

不得不说,一个示例足以证明了 GPT-4 与过往大模型的不同之处,是不是很强大?

与此同时,微软宣布 Bing Chat 一直在 GPT-4 上运行。

当前,OpenAI 计划通过 ChatGPT 及其商业 API 发布 GPT-4 的文本功能,但是想要直接用上,还需要先加入一波等待名单(https://openai.com/waitlist/gpt-4-api)耐心等候。

不过,ChatGPT Plus 用户倒是可以直接上手 GPT-4 的体验:https://chat.openai.com/chat

a5df502aa3c74867b7f0c97b39d278d5.png

GPT-4 惊喜上线

虽然此前 OpenAI 首席技术官 Mira Murati 不断给大家打预防针,希望外界能够对下一代 GPT(即 GPT-4)的技术水平更加冷静务实一些,少一些炒作会更好些,但是当 GPT-4 真正到来时,大家还是坐不住了。

“我们花了 6 个月的时间,利用对抗性测试项目以及 ChatGPT 的经验,反复调整 GPT-4,结果在真实性、可操作性以及拒绝超出道德等边界方面取得了有史以来最好的结果(尽管远非完美)”,OpenAI 分享道。

671c16f93da825bd8a1173a361b7bad0.png

GPT-4:可以达到应试者的前 10% 水平、一张草图生成网站

为让众人更加清楚地了解 GPT-4,OpenAI 官方不仅上线了介绍性的网页(https://openai.com/research/gpt-4)。

还发布了一篇技术论文,详细分享了 GPT-4 强大的功能,以及其存在的局限性。(https://cdn.openai.com/papers/gpt-4.pdf)

7a46be19d5af297685d94e363dc1bb30.png

从技术维度上来看,GPT-4 是一个基于 Transformer 的模型,经过预训练,可以预测文档中的下一个 token。这个项目的一个核心部分是开发了基础设施和优化方法。这使 OpenAI 能够根据不超过 GPT-4 的 1/1000 的计算量训练的模型,准确地预测 GPT-4 的某些方面的性能。

也正如昨天 CSDN 报道的,微软的 Azure 与 OpenAI 共同设计了一台超级计算机,搭载了英伟达上万颗 A100 芯片。基于这台超算,OpenAI 在一年前将 GPT-3.5 作为系统的第一次“测试运行”进行了训练,在修复一些 Bug 并提高理论基础之上,OpenAI 基于此又训练出了首个能够提前准确预测其训练性能的大模型 GPT-4。

更长的上下文,上限为 2.5 万个字

在性能上,GPT-4 超越了过往的模型,它可以遵循自然语言的复杂指令、生成技术或创意作品,支持生成和处理多达 32,768 个 token(约 25,000 字的文本),这使得 GPT-4 能有更长的上下文,允许长篇内容创建、扩展对话以及文档搜索和分析等用例。

GPT-4 可以直接上一个好大学

在分析 GPT-4 的能力时,OpenAI 还让该模型参加了统一律师考试、法学院入学考试(LSAT)、研究生入学考试(GRE)的定量、口头推理、分析写作考试以及和各种 AP 科目考试等测试。

考试问题包括选择题和自由解答题,OpenAI 为每种形式设计了单独的提示,并在需要输入的问题中加入了图片。总分是通过结合选择题和自由回答题的分数来确定的,使用的是每个考试的公开方法。

最终结果如下:

06acd3ed43232525775526f29b19542a.png

4cc4c3ddf4d3672dc4ebea5c6b718a99.png

GPT-4 在大多数这些专业和学术考试中表现与人类水平相当。这意味着,如果 GPT-4 是一个仅凭应试能力来判断的人,它可以进入法学院,而且很可能也能进入许多大学。

多模态能力,通过视觉输入看世界

正如文章开头示例展现的一样,GPT-4 可以接受图像作为输入并生成标题、分类和分析。

这意味着 GPT-4 实际上将看到现实世界,为此,OpenAI 也宣布正在和它的合作伙伴 Be My Eyes 一起测试 GPT-4 的图像输入能力,这是一款即将推出的智能手机应用程序,可以直观地解释手机相机所看到的内容。

不过,该功能目前仍限于研究预览,没有公开提供。

超越传统的大模型

在一套传统的 NLP 基准测试中,GPT-4 超过了以前的大型语言模型和大多数最先进的系统(这些系统通常有特定的基准训练或手工工程)。

d98a44cd6a9d8fc5e26138986c2e590b.png

在 MMLU(多任务语言理解)基准测试中,GPT-4 不仅在英语中以相当大的优势胜过现有的模型,而且在其他语言中也表现出强大的性能。在 MMLU 的翻译变体上,GPT-4 的性能优于 GPT-3.5 和其他 LLM(Chinchilla,PaLM)的英语性能,包括低资源语言,如拉脱维亚语、威尔士语和斯瓦希里语。

生成代码、改 Bug 的最佳小能手

除此之外,OpenAI 通过开源评估框架(Eval,https://github.com/openai/evals),用于自动评估 AI 模型性能的框架,允许任何人报告模型中的缺点,以帮助指导进一步改进。

与此同时,GPT-4 对代码有超强的理解能力,可以帮助程序员生成代码,遇上 Bug 时,甚至只要你把错误信息或者代码异常的截图发给 GPT-4,它就能帮你给出相应的提示。

d6634bd7639d31e28ab4b6cef70de57c.png

只需几秒,一张手画草图,GPT-4 直接帮你生成网页

更让人惊奇的是,在官方演示的视频中,手绘一张网站草图:

a637611d82a85c80520b05798f87171b.png

把它拍照发给 GPT-4,GPT-4 甚至可以自动生成网站的原型图。它从图片中提取文字信息并输出到 HTML,一个网站就有了,整个过程只有几秒钟的时间:

另外,GPT-4 也能处理复杂的税务问题。 

d36e14fb2a1b756f05359de1059fb953.png

一系列操作下来,惊呆众人。在上手体验之后,不少网友现身说法:

我不在乎它不是 AGI,GPT-4 是一项令人难以置信的变革性技术。我在 60 秒内重新创建了 Pong 游戏。这是我的第一次尝试。

90015e5804c2c8e849fe7e38525a23de.png

据悉,所有的代码都是 HTML 实现的。

2399b49e1d00fc394a05a19ff9bb6981.png

甚至有人看到了 GPT-4 的强大,开始暗戳戳地暗示起 GPT-5 的模样:

20484de50270ff5180e9ce10687a59f3.png

b14ed4e2fd5fb4986079eb9e67b7ffee.png

不足之处

OpenAI 表示,他们的目标是开发能够在任何智力任务方面取代人类的 AGI,尽管 GPT-4 还没有达到这个目标。

尽管有这样的能力,GPT-4 与早期的 GPT 模型有类似的局限性:它不是完全可靠的,比如,它也会对事实产生“幻觉”,推理出错误的结果。

对此,OpenAI 首席执行官 Sam Altman 在推特上说:"它(GPT-4)仍然有缺陷,仍然有局限性,但它在首次使用时仍然能给你留下深刻印象。"

e6a7a2875f78ec6d253c1c3ffb1a57ac.png

在使用 GPT-4 的输出时,应该小心谨慎,特别是在专业性要求非常高的重要场景中。

10c8e428bc2b37b8d97167709512c466.png

微软:新 Bing 早用上了 GPT-4

这也是事实,GPT-4 远非完美。不过根据 OpenAI 的说法,研究人员纳入了更多的人类反馈,包括 ChatGPT 用户提交的反馈,用来改善 GPT-4 的行为。此外,OpenAI 公司还聘请了 50 名人类专家,在人工智能安全方面提供反馈。

如今微软同时宣布自家产品早已第一时间用上了 GPT-4。"我们很高兴地确认,新的 Bing 正在 GPT-4 上运行,为搜索而定制,"微软在一篇博客文章中写道。"如果你在过去六周的任何时候使用过预览版的新 Bing,你已经提前看到了 OpenAI 的最新模型的力量。随着 OpenAI 对 GPT-4 及以后的更新,Bing 从这些改进中受益,以确保我们的用户拥有最全面的副驾驶功能。"

b1f7e2f51ca60788b585fa75847ea8be.png

da048e38ed2c90d52df9a3cabbb6a3fd.png

压力给到国外的 Google,国内的百度

虽然上周 OpenAI 早已预告过 GPT-4 会在本周到来,但是真正到来时,还是让很多人猝不及防。而之所以选择此时发布,似乎也是为微软将在 3 月 16 号的 AI 最新进展做一定的铺垫,这样微软可以在明天轻松开上一场发布会了。不过,处于同赛道的其他玩家可能得连夜加班了。

这不,就在这一天,Google CEO 皮查伊亲自下场官宣开放预训练大模型(PaLM,https://www.datalearner.com/ai-models/pretrained-models/PaLM)的 API 商业接口,这是 Google 在 2022 年 4 月发布的自然语言预训练大模型,最高参数为 5400 亿。

与此同时,百度早在此前便宣布将会在 3 月 16 日带来文心一言,最终成果不可避免地会与最新的 GPT-4 一较高下,究竟会如何,我们也将在明天揭晓。

参考资料:

https://openai.com/research/gpt-4

https://www.youtube.com/watch?v=outcGtbnMuQ

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/50501.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【12亿】微信月活11.12亿,抖音年赚200亿?中国最受欢迎五大社交平台

在互联网行业,社交一直都是巨头们的兵家必争之地。从QQ到微信,从微博到抖音,新的社交平台在不断出现和崛起,用户也从90后延伸到了00后,而社交时代的风云变幻,也映射了互联网发展趋势以及网友社交方式的变化…

让OpenAI GPT3替我写数据竞赛代码!

★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>> 让OpenAI GPT3替我写数据竞赛代码! OpenAI与ChatGPT OpenAI是在美国成立的人工智能研究公司,核心宗旨在于实现安全的通用人工智能(AGI)。他们开发的ChatGP…

Github Copilot Chat申请,安装,及常见问题解决

文章目录 实际使用效果:申请使用常见问题 参考 Copilot Chat 是Copilot X 引入的预览功能,不但可以像Chatgpt一样聊天,也可以解释代码,bug 修复,也可以生成单元测试。是一个非常有吸引力的功能。 实际使用效果&#xf…

Android 科大讯飞 语音转文字

Android 科大讯飞 语音转文字 语音听写SDK适配安卓6.0需要手动申请权限,各位可以自信查询资料实现,关于语音听写SDK的开发,参考科大讯飞开放平台官网为准 第一,首先去科大讯飞官网注册一个账号:https://console.xfyun.cn/app/myap…

讯飞离线语音合成接入

讯飞离线语音合成接入: 文字转语音的方法 1.Google TextToSpeech 中文语音引擎 Google提供了原生的方法TextToSpeech,但是不支持中文,sad… 不过可以用第三方的语音引擎,eg,讯飞,百度… 详情参考&…

如何高效Prompt?

优先声明,本文来自转载,来源为稀土掘金的腾讯云开发者 的个人主页 - 动态 - 掘金 本文原文来自我问了鹅厂程序员:你们工作中怎么用ChatGPT?如何高效Prompt? - 掘金 如有侵权冒犯,联系立删。 &#x1f44…

解决Mac电脑连接校园网不弹出登陆窗口问题汇总

1.查看你的DNS有没有改过,把自己改过的DNS全部删除,变更为默认的就好。 2.有使用梯子的同学,记得把梯子暂时先关闭一下,然后在连接校园网Wi-Fi。 3.你有登录页面的网址吗?没有的话,让同学复制给你&#xf…

python毕业设计 基于django框架校园鲜花水果商城毕业设计设计与实现

商城功能概要 首页、分类、商品详情页面,包含加入购物车、收藏商品、立即购买、用户登录、订单管理、地址管理;完整的购物流程,商品的加入、编辑、删除、批量选择,收货地址的选择,下单、会员中心(订单、收…

基于Java+SpringBoot+Vue前后端分离校园闲置物品交易网站

博主介绍:✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

案例26:基于Springboot校园社团管理系统开题报告

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

基于Java+Vue+uniapp微信小程序实现餐厅校园订餐平台

博主介绍:✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取联系🍅精彩专栏推荐订阅👇&#x1f…

校园网不能建立到远程计算机,校园网已拒绝远程连接是什么问题及如何解决

校园网已拒绝远程连接是什么问题及如何解决你知道吗?对于正常日常生活中的我们在需要远程进行办公或学习的时候出现这种问题最让人头大了,可是面对这样的问题我们应该如何更好的解决呢?一般出现校园网无法远程连接的原因有太多,这…

天翼校园网连接不上服务器无响应,天翼校园网dns解析出错怎么办

摘要 腾兴网为您分享:苹果手机,芒果tv,闲聊app,爱奇艺视频,步步高等知识经验教程,欢迎大家关注腾兴网。 很多大学生都是用的天翼校园网,在学校办理的便宜好用,不过有在使用中会碰到各种问题&…

天翼校园网连接不上服务器无响应,使用天翼校园客户端提示登陆失败应该怎么处理?...

对于学生党来说,很多人在学校里上网都是使用校园网,校园网要求必须要使用天翼校园客户端才能连接,但是使用这个软件进行连接的时候,有时候我们会遇到“网络异常12006,请求登陆失败”这样的报错,这时候应该怎…

12星座的出生年月日性格_12星座的出生年月以及性格分析 复制的也可以

12星座的出生年月以及性格分析 复制的也可以 12星座的出生年月以及性格分析 复制的也可以 发布时间:2020-12-18 11:51:48 是水瓶座。农历2001年正月初二是公历2001年1月25日。星座按公历(阳历)出生日期算白羊座(3月21日-4月20日)金牛座(4月21日-5月21日)双子座(5月2…

推荐5个神仙软件,个个让你爱不释手

最近陆陆续续收到好多小伙伴的咨询,这边也是抓紧时间整理出几个好用的软件,希望可以帮到大家。 1.视频抓取——硕鼠 一个非常好用的FLV视频下载工具,提供80多个平台的音视频批量下载,而且还支持多线程同时下载,下载速…

赚钱软件哪个赚钱多又容易?资深用户推荐人人都可以赚钱的APP

最近两年,网上的赚钱软件可谓是越来越多了,仅仅是我知道的软件就有好几百款!如此之多的软件,到底哪一个赚钱多又快呢?经过我长时间的测试,最后终于找到了一款赚钱多又快的软件,接下来我就会将这…

能把爱情当游戏玩的星座,无敌!

冠军(天秤座:他们喜欢扑朔迷离的恋情)亚军(天蝎座)、季军(双鱼座) 第四名(射手座) 第五名(水瓶座) 第六名(摩羯座) 第…

摘星-上升篇

学识有限,纯属爱好。以下内容均来自阳光占星,如有冒犯,告知删除! 上升金牛——歌者的哼唱 有这么一类人,可能有着细致柔和的五官,容易发胖的体质以及坚定的眼神。有点害羞与腼腆;喜欢哼唱着小曲…

占星术合理吗?各个星座最喜欢用的表情是什么?

本文转载自 读芯术 图源:unsplash 通过分析数千条推文,我们找到了热门的星座推特账号,利用机器学习Bertmoticon包来分析预测每个星座的表情。结果让我们大吃一惊! 首先,我们在推特上进行搜索,通过粉丝的数…