10秒生成网站、60秒搞定一个游戏开发!史上最强模型 GPT-4 上线

f58862329601000cc356d405b584e75b.gif

整理 | 苏宓

出品 | CSDN(ID:CSDNnews)

平地一声雷,GPT-4 重磅来袭。

3 月 14 日,OpenAI 正式上线新一代人工智能大模型 GPT-4,它是一个大型多模态模型,可以接受图像和文本输入,同时返回文本输出。就像这样:

用户:这幅画有什么好笑的地方?逐一描述它的板块。

43b35a96e39eefbdcef1833af7341f8a.png

图片来源:https://www.reddit.com/r/hmmm/comments/ubab5v/hmmm/

GPT-4:图片显示的是一个 "Lightning Cable "适配器的包装,有三个板块:

板块1:一部智能手机,VGA 连接器(通常用于电脑显示器的大型蓝色 15 针连接器)插在其充电端口。

板块2:"Lightning Cable "适配器的包装上有一张 VGA 接口的图片。

板块3:VGA 连接器的特写,末端是一个小的 Lightning 连接器(用于为 iPhone 和其他苹果设备充电)。

这张图片的幽默感来自于将一个大的、过时的 VGA 连接器插入一个小的、现代的智能手机充电端口的荒谬性。

不得不说,一个示例足以证明了 GPT-4 与过往大模型的不同之处,是不是很强大?

与此同时,微软宣布 Bing Chat 一直在 GPT-4 上运行。

当前,OpenAI 计划通过 ChatGPT 及其商业 API 发布 GPT-4 的文本功能,但是想要直接用上,还需要先加入一波等待名单(https://openai.com/waitlist/gpt-4-api)耐心等候。

不过,ChatGPT Plus 用户倒是可以直接上手 GPT-4 的体验:https://chat.openai.com/chat

afca026a6e6dce9bff959df099f35a5b.png

GPT-4 惊喜上线

虽然此前 OpenAI 首席技术官 Mira Murati 不断给大家打预防针,希望外界能够对下一代 GPT(即 GPT-4)的技术水平更加冷静务实一些,少一些炒作会更好些,但是当 GPT-4 真正到来时,大家还是坐不住了。

“我们花了 6 个月的时间,利用对抗性测试项目以及 ChatGPT 的经验,反复调整 GPT-4,结果在真实性、可操作性以及拒绝超出道德等边界方面取得了有史以来最好的结果(尽管远非完美)”,OpenAI 分享道。

051126260acd040d5ad73d00179e95fe.png

GPT-4:可以达到应试者的前 10% 水平、一张草图生成网站

为让众人更加清楚地了解 GPT-4,OpenAI 官方不仅上线了介绍性的网页(https://openai.com/research/gpt-4)。

还发布了一篇技术论文,详细分享了 GPT-4 强大的功能,以及其存在的局限性。(https://cdn.openai.com/papers/gpt-4.pdf)

9e17755a68a8dff93569a56d6f5cfe33.png

从技术维度上来看,GPT-4 是一个基于 Transformer 的模型,经过预训练,可以预测文档中的下一个 token。这个项目的一个核心部分是开发了基础设施和优化方法。这使 OpenAI 能够根据不超过 GPT-4 的 1/1000 的计算量训练的模型,准确地预测 GPT-4 的某些方面的性能。

也正如昨天 CSDN 报道的,微软的 Azure 与 OpenAI 共同设计了一台超级计算机,搭载了英伟达上万颗 A100 芯片。基于这台超算,OpenAI 在一年前将 GPT-3.5 作为系统的第一次“测试运行”进行了训练,在修复一些 Bug 并提高理论基础之上,OpenAI 基于此又训练出了首个能够提前准确预测其训练性能的大模型 GPT-4。

更长的上下文,上限为 2.5 万个字

在性能上,GPT-4 超越了过往的模型,它可以遵循自然语言的复杂指令、生成技术或创意作品,支持生成和处理多达 32,768 个 token(约 25,000 字的文本),这使得 GPT-4 能有更长的上下文,允许长篇内容创建、扩展对话以及文档搜索和分析等用例。

GPT-4 可以直接上一个好大学

在分析 GPT-4 的能力时,OpenAI 还让该模型参加了统一律师考试、法学院入学考试(LSAT)、研究生入学考试(GRE)的定量、口头推理、分析写作考试以及和各种 AP 科目考试等测试。

考试问题包括选择题和自由解答题,OpenAI 为每种形式设计了单独的提示,并在需要输入的问题中加入了图片。总分是通过结合选择题和自由回答题的分数来确定的,使用的是每个考试的公开方法。

最终结果如下:

4c6aae3daca27413d8781c6e5a7d5965.png

f2d577aeefb96a0bd8a045a88b5e3039.png

GPT-4 在大多数这些专业和学术考试中表现与人类水平相当。这意味着,如果 GPT-4 是一个仅凭应试能力来判断的人,它可以进入法学院,而且很可能也能进入许多大学。

多模态能力,通过视觉输入看世界

正如文章开头示例展现的一样,GPT-4 可以接受图像作为输入并生成标题、分类和分析。

这意味着 GPT-4 实际上将看到现实世界,为此,OpenAI 也宣布正在和它的合作伙伴 Be My Eyes 一起测试 GPT-4 的图像输入能力,这是一款即将推出的智能手机应用程序,可以直观地解释手机相机所看到的内容。

不过,该功能目前仍限于研究预览,没有公开提供。

超越传统的大模型

在一套传统的 NLP 基准测试中,GPT-4 超过了以前的大型语言模型和大多数最先进的系统(这些系统通常有特定的基准训练或手工工程)。

105cfafe2aea238d41704d08edd0fa9d.png

在 MMLU(多任务语言理解)基准测试中,GPT-4 不仅在英语中以相当大的优势胜过现有的模型,而且在其他语言中也表现出强大的性能。在 MMLU 的翻译变体上,GPT-4 的性能优于 GPT-3.5 和其他 LLM(Chinchilla,PaLM)的英语性能,包括低资源语言,如拉脱维亚语、威尔士语和斯瓦希里语。

生成代码、改 Bug 的最佳小能手

除此之外,OpenAI 通过开源评估框架(Eval,https://github.com/openai/evals),用于自动评估 AI 模型性能的框架,允许任何人报告模型中的缺点,以帮助指导进一步改进。

与此同时,GPT-4 对代码有超强的理解能力,可以帮助程序员生成代码,遇上 Bug 时,甚至只要你把错误信息或者代码异常的截图发给 GPT-4,它就能帮你给出相应的提示。

ee0f8caa7be09ded3b487cea4bba7c94.png

只需几秒,一张手画草图,GPT-4 直接帮你生成网页

更让人惊奇的是,在官方演示的视频中,手绘一张网站草图:

9eb3b727a957a14507053be8b46392b3.png

把它拍照发给 GPT-4,GPT-4 甚至可以自动生成网站的原型图。它从图片中提取文字信息并输出到 HTML,一个网站就有了,整个过程只有几秒钟的时间:

另外,GPT-4 也能处理复杂的税务问题。 

f3b9f9f4deb7a421acd49d3671d4441c.png

一系列操作下来,惊呆众人。在上手体验之后,不少网友现身说法:

我不在乎它不是 AGI,GPT-4 是一项令人难以置信的变革性技术。我在 60 秒内重新创建了 Pong 游戏。这是我的第一次尝试。

8a0cca89c16453e1edba5b22922a11cd.png

据悉,所有的代码都是 HTML 实现的。

d47cf5c9896c3275f5ff5360fc962f12.png

甚至有人看到了 GPT-4 的强大,开始暗戳戳地暗示起 GPT-5 的模样:

941932e876e7ef82e5d9d298d7faa58e.png

581391f7b7673557fd526bf41dc0c64f.png

不足之处

OpenAI 表示,他们的目标是开发能够在任何智力任务方面取代人类的 AGI,尽管 GPT-4 还没有达到这个目标。

尽管有这样的能力,GPT-4 与早期的 GPT 模型有类似的局限性:它不是完全可靠的,比如,它也会对事实产生“幻觉”,推理出错误的结果。

对此,OpenAI 首席执行官 Sam Altman 在推特上说:"它(GPT-4)仍然有缺陷,仍然有局限性,但它在首次使用时仍然能给你留下深刻印象。"

19c1741b47e36d711b1a80b11b4eed91.png

在使用 GPT-4 的输出时,应该小心谨慎,特别是在专业性要求非常高的重要场景中。

0d4e97f7307a61953ec7c19d9963a47d.png

微软:新 Bing 早用上了 GPT-4

这也是事实,GPT-4 远非完美。不过根据 OpenAI 的说法,研究人员纳入了更多的人类反馈,包括 ChatGPT 用户提交的反馈,用来改善 GPT-4 的行为。此外,OpenAI 公司还聘请了 50 名人类专家,在人工智能安全方面提供反馈。

如今微软同时宣布自家产品早已第一时间用上了 GPT-4。"我们很高兴地确认,新的 Bing 正在 GPT-4 上运行,为搜索而定制,"微软在一篇博客文章中写道。"如果你在过去六周的任何时候使用过预览版的新 Bing,你已经提前看到了 OpenAI 的最新模型的力量。随着 OpenAI 对 GPT-4 及以后的更新,Bing 从这些改进中受益,以确保我们的用户拥有最全面的副驾驶功能。"

ab2f0c92b1c73ce93cbe457df39419de.png

2c01496ca83de316821fbd86038be1b7.png

压力给到国外的 Google,国内的百度

虽然上周 OpenAI 早已预告过 GPT-4 会在本周到来,但是真正到来时,还是让很多人猝不及防。而之所以选择此时发布,似乎也是为微软将在 3 月 16 号的 AI 最新进展做一定的铺垫,这样微软可以在明天轻松开上一场发布会了。不过,处于同赛道的其他玩家可能得连夜加班了。

这不,就在这一天,Google CEO 皮查伊亲自下场官宣开放预训练大模型(PaLM,https://www.datalearner.com/ai-models/pretrained-models/PaLM)的 API 商业接口,这是 Google 在 2022 年 4 月发布的自然语言预训练大模型,最高参数为 5400 亿。

与此同时,百度早在此前便宣布将会在 3 月 16 日带来文心一言,最终成果不可避免地会与最新的 GPT-4 一较高下,究竟会如何,我们也将在明天揭晓。

参考资料:

https://openai.com/research/gpt-4

https://www.youtube.com/watch?v=outcGtbnMuQ

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/56897.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

史上最强模型 GPT-4 上线:一张手绘草图能生一个网站、60 秒搞定一个游戏开发!

平地一声雷,GPT-4 重磅来袭。 3 月 14 日,OpenAI 正式上线新一代人工智能大模型 GPT-4,它是一个大型多模态模型,可以接受图像和文本输入,同时返回文本输出。就像这样: 用户:这幅画有什么好笑的…

微软Bing Chat全面开放,所有人可用!官宣多项重大升级,日活用户超过1亿

来源:AI前线 作者:冬梅 当地时间 5 月 4 日,根据 The Verge 报道,微软宣布公司旗下基于 ChatGPT-4 的 Bing Chat 功能已进入开放预览(Open Preview)模式,也就是面向所有用户开放。 在此之前&…

OneFlow源码解析:Eager模式下的SBP Signature推导

作者|郑建华 更新|赵露阳 OneFlow 的 Global Tensor 有两个必要属性: Placement:决定了 tensor 数据分布在哪些设备上。 SBP:决定了 tensor 数据在这些设备上的分布方式。例如: split:将切分后…

2021考研政治腿四错题、重点题汇总

腿姐(一)(25/50) 腿姐(二)(30/50) 腿姐(三)(19/50) 腿姐(四)(34/50) 腿腿子的题好刁钻啊,做的好难…

校招选择题汇总【图形推理(1)】含答案解析

图形推理50中规律,自行阅读 1. 大小变化 2. 方向旋转 3. 笔画增减 ( 数字 , 线条数 ) 4. 图形求同 5. 相同部份去掉 6. 图形叠加 ( 简单叠加 , 合并叠加 , 去同叠加 ) 7. 图形组合变化 ( 如: 首尾两个图形中都包含中间图形 ) 8. 对应位置阴影变化 ( 两图相同或不同则…

【考研政治】2021肖八整理(时政部分)

【考研政治】2021肖八整理(时政部分) 前言 写一下肖八的笔记。之前写了《【考研政治】2021肖八整理(马克思部分)》、《【考研政治】2021肖八整理(思修部分)》。 今天结合《【考研政治】时政(…

什么是标书?有哪些类型?

标书是由发标单位编制或委托设计单位编制,向投标者提供对该工程的主要技术、质量、工期等要求的文件。 标书是招标工作时采购当事人都要遵守的具有法律效应且可执行的投标行为标准文件。它标书也是投标商投标编制投标书的依据投标商必须对标书的内容进行实质性的相…

菜鸡程序员是如何写代码的?

每个程序员都要历经从菜鸡到大牛过程蜕变胡过程。当初大家起点都差不多,工作多年后,有些人依然停留在菜鸡,有些人却已成为大牛,所有的事情,都是一点一滴习惯养成。让我们看看菜鸡程序员是如何写代码的?有可…

看完这篇文章,还不知道怎么学单片机,来打我!

大家好,我是张巧龙,今天给大家分享一篇文章,来自科岩大佬,推荐大家阅读! 经常有人问我,嵌入式该怎么入门,怎么学习,怎么精通,怎么成为专家。我前思后想掏心掏肺&#xff…

开放原子训练营(第二季)RT-Thread Nano学习营线下学习心得

前言 目前市面上有很多种RTOS(Real-time operating system,实时操作系统),还在犹豫选择学习哪种RTOS的小伙伴,推荐你们学习RT-Thread操作系统,这也是本人最喜欢的一个RTOS,喜欢的原因很简单&am…

21届本科大数据菜鸡:我是怎么在互联网寒冬拿到腾讯、华为、京东、美团、快手等大厂offer的?

YOU CAN 前言正文不要自卑,去提升实力互联网行业谁技术牛谁是爹你这么聪明,你会被游戏控制?朋友是你在玩它。 前言 学得越多,不会得越多 活着就是为了改变世界 下一阶段目标:工作第一年攒10w,在老家买房子付…

关于菜鸡在安装paddle时遇到的坑

关于解决安装paddle 遇到的困难困难的开头后续终于的终于 遇到的困难 原本希望在win环境下安装 paddle 模块,但是感觉win对于paddle不太友好,需要下载docker tool中安装Docker,然后再在其中下载paddle。所以突然想着在虚拟机中的centos7系统…

菜鸡程序员的一天都在折腾些什么?

在影视作品中,程序员多以技术大神的形象出现。 他们经常在电脑上随意插一个U盘,对着黑色的界面飞速敲下绿色的代码,10秒钟后合上电脑,冲主角邪魅一笑表示“我已经黑进五角大楼了。” 邪魅一笑.gif 别急着崇拜。当我入了这一行后&…

半路出家的菜鸡程序员,北漂五年,给刚入行朋友的一些忠告,发自肺腑

大家好,我是陈哈哈。认识我的朋友们知道,我是非科班出身,半路出家,大学也很差!这种背景来北漂,你都不知道你会经历什么🙃🙃。   如今虽没有风生水起,但在技术这块儿也算…

无监督学习 — — 聚类方法分类

无监督学习 — — 聚类方法分类 0. 聚类1. K均值聚类(1). K均值聚类存在问题:(2). K均值聚类实现代码: 2. 凝聚聚类(1). 凝聚聚类实现代码: 3. DBSCAN 聚类(1…

菜鸡教程(1):简易游戏每周推荐小程序制作

写在前面: 1. 阅读本文最好具备一定htmlcssjs基础,并已成功注册微信小程序,成功下载了开发工具   2.菜鸡菜笔,如有不正,还请大佬们不吝惜赐教 接下来开始小程序的制作 1.首先需下载小程序所需图片 2.hello world(万物的起源&…

HFSS学习日记

(纯纯菜鸡,不懂理论和专业术语,单纯记录遇到的问题,欢迎大家批评指正) 1.仿真天线模型,工作频率与预期有偏差,可能的原因有: 空气盒子的长度设置过小。当对天线在一定的频率范围内进…

菜鸡前端2022年总结

我正在参加2022年,博客之星评比,请投我一票。 点此链接,投我一票 再过两年回家种地啦,年总结,写一年,少一年。 简单回顾一下今年,有哪些遗憾,有哪些成果。 工作 今年工作上的内…

三种常见的移动底盘运动学模型分析

目录 前言 一、四轮差速运动模型 二、麦克纳姆轮运动学模型 三、两轮差速运动学模型 总结 前言 现在大三暑假,开学就要着手准备毕设了,接手了实验室师兄的激光SLAM小车项目,先从下位机学起,争取把整个项目接受下来&#xff…

菜鸡学Unity 之 坑神之路 (记录坑点,不断更新中~)

LZ-Says:万事儿开头难,枪在手,不得不发~ 前言 最近在了解Unity这块的内容,不得不说,新的领域,陌生的代码世界,初入茅庐,太多的陌生与不适,唯有咬紧牙关,坚持…