超级模型GPT-4发布!

本文来源  量子位 

一觉醒来,万众期待的GPT-4,它来了!

OpenAI老板Sam Altman直接开门见山地介绍说:

这是我们迄今为止功能最强大的模型!

b2137e16a47b10557755718feff55056.png

有多强?

根据OpenAI官方的介绍,GPT-4是一个超大的多模态模型,也就是说,它的输入可以是文字(上限2.5万字),还可以是图像。

(看图)手套掉下去会怎样?

它会掉到木板上,并且球会被弹飞。

bfb51495a2080923d4cd8b628990c611.gif

甚至只需要简单在纸上画一个网站的草稿图:

24e53759486735ae7952fbc6ec4496c5.gif

拍一张照片上传给GPT-4,它就可以立马生成网站的HTML代码!

58f325c1a8ce671a78fc7dceda2c9c0f.gif

在性能表现上,OpenAI直接甩出一句话:

在各种专业和学术基准上和人类相当

而且不只是发布GPT-4这么简单,OpenAI这次“啪的一下”把相关“大动作”一步到位了:

  • ChatGPT Plus:集成GPT-4的ChatGPT升级版

  • 发布GPT-4的API

  • 公布技术论文 * 公开System Card

不仅如此,传闻的“必应早就用上了GPT-4”在今天也得到了微软方面的证实:

没错,确实是这样的!

9569f94f6a8d1b9fe4b016a0e07442f7.png

不得不说,自打ChatGPT问世以来,微软和谷歌之间打响的数轮科技战役,微软这次又双叒叕赢麻了。

甚至这一次,不少网友都发出了“见证历史”的感慨:

9febb368734ef567bb8ef4edfa0ff7c9.png

史上最强大模型

正如之前传言,GPT-4确实拥有多模态能力,可以接受图像输入并理解图像内容。

并且可接受的文字输入长度也增加到3.2万个token(约2.4万单词)。

升级之后,GPT-4在各种职业和学术考试上表现和人类水平相当。

比如模拟律师考试,GPT-4取得了前10%的好成绩,相比之下GPT-3.5是倒数10%。

做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)。

82df7b241a18b5f854c635e359367b5f.png

那么GPT-4这些新能力实际用起来是什么样的?技术报告中也给出不少展示。

首先,看图能力可以用来解释表情包、梗图。

提问这张图哪里好笑?GPT-4可以按顺序描述出每一格的内容,并总结出笑点:

用巨大的过时VGA接口给小巧的现代智能手机充电。

198a7fa0ad8936b8953e41947d9aff07.png

更进一步,GPT-4可以理解图表中数据的含义,并做进一步计算。

ddd5e9ff62dcde3b0655ffa3357df2df.png

甚至可以直接把论文截图发给它,GPT-4可以按像素处理其中的文字和图片,并给出对整篇论文的总结摘要。

2059ce9bcaa920e23a853ae50b792eff.png

文字输入长度限制的增加,也大大扩展了GPT-4的实用性。

发布会直播上,OpenAI总裁Gregman现场表演了一波GPT-4给代码修Bug。

出现问题啥也不用想,直接把1万字的程序文档一股脑扔给GPT-4就行。格式也不用管,你只需要Ctrl+A、Ctrl+C、Ctrl+V。

1c16098c357e6613a28c73d0b5e132a5.gif

再最后附上出现的问题,在几秒钟内瞬间得到解决办法。

432a973ae29fc8321ca979e680dd56bf.png

在API方面,GPT-4还开放了一个使用功能,允许修改“系统提示”。

之前ChatGPT的回答总是冗长而平淡,这是因为系统提示中规定了“你只是一个语言模型……你的知识截止于2021年9月”。

现在通过修改这句话,GPT-4就可以展现出更多样的性格,比如扮演苏格拉底。

98e4d36aab92d2b0aafb39a51764a04d.png

也可以指定之后所有回答的形式,比如全用json格式。

16e20a7bc7ebf44ef2f1f689d63ea823.png

虽然GPT-4这波能力大升级,但之前ChatGPT会出现幻觉、胡说八道的毛病还是没能完全改掉。

从前面的官方示例也可以看出,要想最大程度发挥GPT-4的能力,最好还是用上思维链路提示(Chain-of-thought Prompt)。

操作起来也非常简单,只需在提问的时候额外提醒AI给出步骤,就能大大提高推理和计算的准确率。

谷歌依旧在跟

就在GPT-4发布前,谷歌方面为了迎战微软,宣布将一系列即将推出的AIGC功能,应用到自家产品中。

包括谷歌 Docs(文档)、Gmail、Sheets(表格)和 Slides(幻灯片)。

19e376a7a4ed173f69b426e205a792c8.png

但不同于微软和OpenAI的“发布即可用”,谷歌只会先将Docs和Gmail中的AI工具,在月底提供给一些“值得信赖的开发人员”。

而其它功能则将是在今年晚些时候向公众开放。

至于具体时间,谷歌方面并没有具体说明。

而外界对此评价是谷歌希望抢先微软原定于本周四的发布。

但从今天的结果上来看,微软依旧提前“抢滩登陆”。

e9786aa68e96298e332c11d256c277d7.png

One More Thing

在GPT-4发布之前,便有网友做出了GPT-3和GPT-4参数量的对比图,并猜测GPT-4的参数量将达到100万亿。

这一次亦是如此。

有网友预言,未来GPT-5的参数量,会是这样的:

a87357d80570b05e6ec71afece7d01b3.png

但无论如何,这一次,我们离真·人工智能,更近了一步。

参考链接:

[1] https://openai.com/research/gpt-4
[2] https://blogs.bing.com/search/march_2023/Confirmed-the-new-Bing-runs-on-OpenAI%E2%80%99s-GPT-4
[3] https://www.youtube.com/watch?v=outcGtbnMuQ

猜您喜欢:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

467751414841730c1b0aaa680021a07a.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

欢迎加入 GAN/扩散模型 —交流微信群 !

扫描下面二维码,添加运营小妹好友,拉你进群。发送申请时,请备注,格式为:研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖

883e4029ca369209915c290998ab1536.jpeg

请备注格式:研究方向+地区+学校/公司+姓名

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/61367.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

透过现象看本质 | GPT爆火的背后

前言: 近年来,GPT(Generative Pre-trained Transformer)作为一种革命性的语言模型,以其强大的文本生成能力和广泛的应用领域引发了全球范围内的热议。然而,GPT爆火的背后,是一个更加深刻的本质。…

2014年考研英语二作文PartB图表题

作文详细解析 题目 Write an essay based on the following chart, in which you should interpret the chart, and give your comments You should write about 150 words on the ANSWER SHEET.(15 points) 注意点 1.图表题在第一段描述图表信息时,一定要写清楚y轴变化…

【考研】2018-Part B 作文(英一)

前言 10月要开始冲刺英一作文,会陆续推出 2013 - 2022 英一 Part A 和 PartB 的优秀范文,并用红色字体标明应用模板,并列举重点单词和词组,以积累词汇。 一、2018 Part B (一)题目及解析 提示信息信息解析…

python代码打包成可执行文件(exe)

【前言】:我们在开发完一个小项目后,想要把项目发布出来给别人用。通常都会把代码打包成exe后再给别人,而不是让别人去安装运行环境再跑裸代码。本文就是介绍如何使用pyinstaller这个工具将python带包成可直接运行的exe。 ▍概述 在介绍pyi…

关于Vivado中Vitis Model Composer无法打开的解决办法

目录 一、问题1、问题描述2、WINR键 在命令窗口中操作 二、解决办法 一、问题 1、问题描述 安装好官方提供的vivado 2021.1及其他扩展内容之后,双击无法打开Vitis Model Composer,只有命令窗口一闪而过; 2、WINR键 在命令窗口中操作 按如图…

jupyter闪退的解决方法以及卸载与安装教程

问题: 今天打开电脑准备使用jupyter,双击后指令窗口打开后闪退,无法正常使用软件,报错: C:\Users\***>jupyter notebook --generate-config Traceback (most recent call last): File "D:\LeStoreDownload\…

chatgpt赋能python:Python如何用快捷键运行程序?

Python如何用快捷键运行程序? Python是一门广泛使用的编程语言,开发者用它设计各种类型的程序和应用。在Python编程中,开发者需要经常运行程序来查看程序的输出结果。使用快捷键可以提高我们编写代码的效率和方便程度。那么,Pyth…

chatgpt赋能python:为什么我的Python程序经常闪退?详解Python闪退的原因及解决方案

为什么我的Python程序经常闪退?详解Python闪退的原因及解决方案 Python作为一门高级编程语言,在过去的十年中已经成为了众多开发者的首选语言。但是,即使是有10年Python编程经验的开发者,有时候也会遇到闪退的问题。这种问题很头…

chatgpt赋能python:Python运行为什么会闪退?可能的原因和解决方法

Python运行为什么会闪退?可能的原因和解决方法 如果你是一名有10年Python编程经验的工程师,你一定遇到过这种情况:当你想运行一个 Python 脚本或程序时,它会闪退,无法正常运行。这种情况有很多可能的原因,…

简单认识钢琴五线谱

作者:xg123321123 - 时光杂货店 出处:http://blog.csdn.net/xg123321123/article/details/77918249 声明:版权所有,转载请联系作者并注明出处 在提到五线谱之前,先简单认识下钢琴键盘。 钢琴键盘是由黑色键和白色键共…

核心乐理---五线谱基础

音符 音符的长度 音符的长度都是相对的定义 一般来说讲全音符设为一拍,但如果将二分音符设为一拍的话,全音符就是两拍 附点音符 可以在音符后跟上一个小点来改变音符的长度,如果一个音符后面跟了n个原点,它的长度就会变为原来的…

【五线谱】音高表示 ( 高音谱号 | C3 60 ~ B3 71 音高表示 | C4 72 音高表示 | C5 84 音高表示 )

文章目录 一、C3 ~ B3 音高表示1、C3 音符2、D3 音符3、E3 音符4、F3 音符5、G3 音符6、A3 音符7、B3 音符 二、C4 音高表示三、C5 音高表示 一、C3 ~ B3 音高表示 参考 【音频处理】音高 与 频率 对照表 ( 音符频率算法 ) 博客 , 分析音高与对应频率 ; 1、C3 音符 C3 音符 表示…

“邀请码” - 诈骗类应用分析

一、简述 该恶意应用运行后,私自读取用户的联系人和历史短信记录,后台静默上传到C2服务器,造成用户的隐私信息泄露。 二、样本信息 包名:fujinyueai.yes 应用名:附近约爱 文件SHA1:6c96510ba1b27d939dae7be…

恶意访问、黑产猖獗,如何做好业务安全“守门人”?丨创新场景50

关注ITValue,看企业级最新鲜、最价值报道! 数字化就是创新场景的叠加,钛媒体将推出「创新场景50」系列经典实例,遴选全行业优先应用案例,用通俗易懂的语言针对数字化创新实例进行解读汇总。后续将积累内容产品化&#…

解密加密的直播地址

现在国内除了斗鱼,熊猫等大的直播平台以外,还有很多的小平台,小平台技术有限,今天拿一个app示例 一般未加密的直播地址,直接用fidder就可以抓取到地址,但一些安全性较高的返回的地址是经过加密的,今天就来解密下某直播(你懂得)的地址(这个平台早gg了). 下面就是返回的直播地址…

互联网平台黑产解密(上)

互联网平台黑产解密(上) 这是一个最好的时代。互联网如此普及,市场有无限可能,大量的创业公司崛起,生活服务无不能连接到互联网,让人有了更多想象。 这也是最坏的时代。伴随着新型业务的出现和增长,黑色产业(以下简称黑…

直播带货app源码,进行直播平台的环境部署

直播项目环境部署 最近总是接到直播带货app源码的开发,在环境部署的过程中踩了不少坑。现在我将环境部署的完整教程分享给大家。 一 、搭建前期准备 注:操作系统centos7.0以上 64位,直播带货app源码服务器是否需要添加域名白名单(…

社群编码识别黑灰产攻击实践

导读:所谓黑灰产,包含网络黑产、灰产两条产业链,随着互联网的飞速发展,网络黑灰产也在不断演变,当前网络黑灰产已经趋于平台化、专业化、精细化运作。基于黑灰产攻击特点,我们提出了一种基于社群编码的黑灰…

直播鉴黄?直播商城开发是如何实现的

截图鉴黄配置的方式有哪些? 直播商城开发最重要的一步,就是实现直播鉴黄的功能,那么接下来就和我一起看看直播鉴黄是如何实现的吧。 方式:1,通过API设置;2,在【控制台】【功能模板】进行配置。…

超千人围观,普及 “反诈” 常见场景及应对手段,还有黑灰产攻防手段

10 月 26 日,由软件绿色联盟举办的 “反诈” 主题直播活动已圆满落幕。本次直播我们特邀了两位 360 的资深技术专家,对《电信网络诈骗趋势解读与应对》、《黑灰产攻防手段及关联产业链》两大议题进行了精彩分享。本次直播吸引了 1000 名线上观众观看&am…