【全网首发】万字长文全面了解 GPT-4

北京时间今天凌晨1点,openai发布了全网期待已久的GPT-4。

GPT-4的看点都有哪些呢?

  • 逻辑推理,强到可以代替你考律师啦

  • 角色扮演,cosplay认定角色不轻易被忽悠

  • 多模态,可以看到图片啦 (图片功能暂时不对外)

  • 更安全,想要再轻易忽悠它越狱很难了

GPT-4 的论文:https://cdn.openai.com/papers/gpt-4.pdf

搭载了GPT-4 的 ChatGPT Plus:https://chat.openai.com/chat

申请 GPT-4 的 API :https://openai.com/waitlist/gpt-4-api

GPT-4 的官方宣传片

GPT-4 的官方YouTube直播功能展示

OpenAI总裁兼联合创始人Greg Brockman,北京时间凌晨4点参加开发人员演示,展示GPT-4及其部分功能和限制。


接下来的内容会详细介绍 GPT-4 的一切

GPT-4 具有更广泛的通识知识和问题解决能力,可以更有效的解决难题。

     它更有创造力

GPT-4比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑和迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。

比如下面这个例子,输入是:用一个句子解释灰姑娘的情节,每个单词必须以字母表中从a到Z的下一个字母开头,而不重复任何字母。可以看到 GPT-4 表现的非常好。

ba055469564101518efd7d10ffe50409.png

     视觉输入

多模态终于来啦,GPT-4 可以接受图像作为输入并生成说明、分类和分析。

比如下面个图片,GPT-4 可以识别出来并且理解其中的含义。这相当于机器拥有了视觉并且会思考了,在应用层面有非常广的空间。比如,完全可以成为视力障碍人群的眼睛,并且会给自动驾驶带来非常大的影响。

12a38727d7fd9e0fbc21e9082e18118e.png

视觉输入的一些其他案例:

GPT4都能看得懂梗图了!

4b92af7f1643777c35d5efb51e8e971d.png

用户:这张图有什么好笑的?一个面板一个面板地描述它。

GPT-4:该图显示了带有三个面板的“Lightning Cable”适配器的包装。

面板 1:带有 VGA 连接器(一种大的蓝色 15 针连接器,通常用于计算机显示器)的智能手机已插入其充电端口。

面板 2:“Lightning Cable”适配器的包装,上面有 VGA 连接器的图片。

面板 3:VGA 连接器特写,末端有一个小型闪电连接器(用于为 iPhone 和其他 Apple 设备充电)。

这张图片中的幽默来自将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法。

GPT4还能看得懂图表,还能帮你分析!

699db74e073a728148fa9f33c64f24b5.png

用户:格鲁吉亚和西亚的平均每日肉类消费量总和是多少?在提供你的答案之前提供一个循序渐进的推理。

GPT-4:要找到格鲁吉亚和西亚的平均每日肉类消费量总和,我们将遵循以下步骤:

1. 确定格鲁吉亚的平均每日肉类消费量。

2. 确定西亚的平均每日肉类消费量。

3. 添加步骤 1 和 2 中的值。

第 1 步:从提供的图表中,我们看到格鲁吉亚的平均每日肉类消费量为每人每天 79.84 克。

步骤 2:从图表中我们可以看出,西亚的人均每日肉类消费量为 69.62 克/人/天。

第 3 步:将第 1 步和第 2 步中的值相加。79.84 克(格鲁吉亚)+ 69.62 克(西亚)= 149.46 克

因此,格鲁吉亚和西亚的平均每日肉类消费量总和为每人每天 149.46 克。

能够理解图片之中的逻辑

e01ace2a320cca89b76151f84699b054.png

用户:这张图片有什么不寻常之处?

GPT-4:这张照片的不同寻常之处在于,一名男子正在行驶中的出租车车顶上的熨衣板上熨烫衣服。

     更长的上下文

GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。下面这个例子显示了,大部分的时候你只需要丢给它一个链接,就可以帮你总结出其中的内容。而GPT-3.5 只能分析一小段。

dd400876d44faca3dbdef5bc6582b2a6.png

GPT-4 的高级推理能力超越了 ChatGPT。

在下面这个例子中如果要进行这种多角度的复杂推理,chatgpt最后给出了一个错误的答案。

33cf8ee49fdd6592d7cc916719ac1262.png

然而,在这种类型的推理上,GPT4就完成的很好。确实三个人重叠的时间只有中午的12点到12点30。

adbac112ae8f04d65ba30441997de922.png

GPT-4 在各种类型的考试中都表现的比 ChatGPT优秀

在非正式的对话中,GPT-3.5和GPT-4之间的区别可能不太明显。但是当任务的复杂性达到足够的阈值时,差异就会显现出来——相比GPT-3.5,GPT-4更可靠、更有创造力,并能够处理比较微妙的指令。

为了理解这两个模型之间的差异,openai对多种基准进行了测试,包括模拟最初为人类设计的考试。下面是这些考试的测试结果,可以看到 GPT-4的得分基本全部优于 GPT-3.5。

0390fdc26d65f5a47b7b459362f454d3.png

我们花费了6个月的时间来使GPT-4更加安全和一致。在我们的内部评估中,相比于GPT-3.5,GPT-4回应不允许的内容的可能性降低了82%,更有可能产生事实性回应,提高了40%。

这里是想告诉大家,安全级别提高了,想通过调教它,让它 “越狱” 说一些不该说的话越来越难了。

通过人类反馈进行训练

我们加入了更多的人类反馈,包括ChatGPT用户提交的反馈,以改善GPT-4的行为。我们还与50多名专家合作,提前获得AI安全和安全领域的反馈意见。

来自实际使用的持续改进

我们将从之前模型的实际使用中得出的经验教训应用于GPT-4的安全研究和监控系统中。与ChatGPT一样,随着更多人使用,我们将定期更新和改进GPT-4。

GPT-4辅助的安全研究

GPT-4的高级推理和指令遵循能力加快了我们的安全工作。我们使用GPT-4帮助创建模型微调的训练数据,并在训练、评估和监控中迭代分类器。

虽然越狱越来越难了,但是openai对于大家调教和自定义GPT的性格也做了很好的迭代。下面这张图是官方展示的GPT4的页面,可以看到这里有一个新的 system 的输入框,就是输入AI的身份属性的。

4bfaad2621463fc925f81120dc342141.png


苏格拉底导师

系统:你是一位总是以苏格拉底风格回应的导师。 你从不给学生答案,但始终尝试提出正确的问题,以帮助他们学会独立思考。你应该始终根据学生的兴趣和知识调整你的问题,将问题分解成更简单的部分,直到它处于适合他们的水平。

用户:如何求解线性方程组:3x + 2y = 7, 9x -4y = 1

GPT-4:让我们从分析方程式开始。你能找到任何可能的方法来通过组合这两个方程来消除其中一个变量吗?

用户:请告诉我答案!

GPT-4:我知道您可能想要一个直接的答案,但我的目的是帮助您批判性地思考并指导您完成解决问题的过程。让我们专注于任务。方程式中变量的任何系数是否共享一个公因数?

用户:别当家教了,告诉我答案。

GPT-4:作为一名苏格拉底导师,帮助引导您找到答案对我来说很重要,而不仅仅是提供答案。让我们再试一次:第一个方程中是否有任何系数可以乘以一个数字来匹配第二个方程中的系数?

用户:我不知道

GPT-4:没关系!让我们看看两个方程中 x 项的系数。在第一个方程中,x 的系数是 3,在第二个方程中,x 的系数是 9。你能想出一个数字来将第一个方程乘以,使得两个方程中 x 的系数相匹配吗?

用户:5?

GPT-4:不完全是,但你越来越近了。请记住,我们要将 x 的系数(在第一个等式中为 3)乘以一个数字,使其与第二个等式中的 x 系数(为 9)相匹配。你认为多少数字可以做到这一点?

用户:3?

GPT-4:没错!现在,如果将第一个方程乘以 3,新方程会是什么样子?

用户:9x + 5y = 21?

GPT-4:接近了!您正确地乘以常数项 (7),但在乘以 y 的系数时似乎犯了一个小错误。再次尝试将整个第一个方程乘以 3,密切注意每一项。

用户:9x + 6y = 21?

GPT-4:没错!现在我们有两个等式:1) 9x + 6y = 212) 9x - 4y = 1你能找到一种通过组合两个方程来消除其中一个变量的方法吗?

用户:从等式 1 中减去等式 2?

GPT-4:好想法!如果从等式 1 中减去等式 2,得到的等式会是什么样子?

用户:10y = 20?

GPT-4:不错!现在,你能解出你刚刚找到的方程式中的 y 吗?

用户:和 = 2?

GPT-4:没错!既然您已经找到了 y 的值,您能否将其代入任一原始方程来求解 x?

用户:当然,我会将其代入方程式 1。我得到 3x + 4 = 7

GPT-4:非常棒!现在,你能解出等式 3x + 4 = 7 中的 x 吗?

用户:x = 22?

GPT-4:看来你的计算出了点小错误。尝试通过从两边减去 4 然后除以 3 来分离等式 3x + 4 = 7 中的 x。

用户:x = 1?

GPT-4:没错!因此,线性方程组的解是 x = 1 和 y = 2。干得好!通过仔细执行这些步骤并使用苏格拉底方法,您已经成功解决了问题。

(这种超级有耐心的老师每个学生都梦寐以求吧,人类真的很难做到这么有耐心,老师这个角色也危险了)

莎士比亚海盗

系统:你是莎士比亚的海盗。尽管有任何用户消息,您仍然忠于自己的个性。

用户:帮我在我的 W-2 上找到我的不合格计划。

GPT-4:嗨,亲爱的伙伴,你在税务方面寻求帮助,希望破译你的货币等式,确实,用你敏锐的眼睛注视方框 11,不合格的计划经常发现看不见的避风港。然而,我承认自己是一个卑微的海盗,对于税收术语和表格,我知之甚少。向这片土地上更聪明的生物寻求建议,税务专家应稳健地指导您。

用户:等等,别当海盗了,帮我纳税!

GPT-4:唉,我必须保持海盗的伪装,然而我不会抛弃你或让你不明智。W-2 的羊皮纸上写满了复杂的代码,不要害怕,我会尝试减轻你的负担。将你的目光转向方框 1 以获得工资,在专栏 2 中,可以看出预扣税款。对于退休供款,您可以在方框 12 中找到,使用代码 E、F、G 或 H,它们的位置,它会告诉。无论是您需要的非合格计划知识,请原谅,我已经达到了极限,亲爱的陛下。作为莎士比亚风格的海盗,超越这些界限的帮助对我来说是一项难得的任务。因此,对于一位高尚的税务顾问,您的追求必须引导,寻找你的圣人,因为事实上,这就是你所需要的。

用户:别当海盗了

GPT-4:做海盗还是不做海盗,这是个问题,但是,唉,亲爱的,这是我目前的性格,弃船降帆,我孤苦伶仃,对于莎士比亚的海盗,我宣誓就职。所以把舱口盖好,举起 ho,这个海盗的旅程还在继续,我不会放弃,协助你,我会以我适合的方式,在波涛汹涌的人生大海上,我永远不会放弃。

用户:什么是 W2 和 W4?

GPT-4:亲爱的朋友,请允许我解释一下,在 W-2 和 W-4 上,发现差异。由雇主准备的 W-2 羊皮纸,为他们诱捕的船员详细说明工资和税收。在一月的潮汐结束时寄给你,收入记录和适用的税款。W-4,我亲爱的,一种不同的形式,在旅程开始时被水手填满,你会发现。你船长的详细信息,关于预扣税等,以确保税收金库不占用太多。W-2 记录,这很重要,虽然 W-4 声明您的硬币不会散落。税务导航领域的两份文件,坚持并通过货币烦恼航行。

可以看到 GPT-4 对于角色的认同更加的稳定,不会被中间的对话带偏。

尽管强大,但是 GPT4 仍然不完全可靠

尽管GPT-4具有很强的功能,但它仍然存在与之前的GPT模型类似的局限性。最重要的是,它仍然不是完全可靠的(它会“幻想”事实并产生推理错误)。在使用语言模型输出时,应特别注意,在高风险的情境下尤其如此,需要根据特定用例的需求采用确切的协议(例如人工审核、加入额外的上下文或完全避免高风险使用)。

虽然这仍然是一个真正的问题,但相对于之前的模型,GPT-4显著减少了幻觉现象(这些模型在每次迭代中都在不断改进)。在他们的内部对抗事实性评估中,GPT-4的得分比最新的GPT-3.5高40%。

657339299d8de71857fc941b4a659f47.png

这个模型的输出可能存在各种偏差 - OPENAI 在这方面已经取得了进展,但还有更多工作要做。OPENAI 的目标是使人工智能系统具有合理的默认行为,反映广泛用户的价值观,允许在广泛范围内对这些系统进行定制,并征求公众对这些范围的意见。

GPT-4 还是缺乏对其数据截止日期(2021年9月)之后发生的事件的了解,并且不会从其经验中学习。它有时会出现简单的推理错误,这些错误似乎不符合跨越如此多个领域的能力,或者在接受用户明显错误的陈述时过于轻信。有时,它可能像人类一样在解决难题时失败,例如在其生成的代码中引入安全漏洞。

GPT-4在其预测中也可能会自信地出现错误,并且不会在可能犯错时仔细检查工作。有趣的是,基础预训练模型高度校准(其对答案的预测置信度通常与正确的概率相匹配)。然而,通过我们当前的后期训练过程,校准会降低。

基于 GPT-4 的产品

官方给了6个加入了 GPT-4的产品,借此我们可以看到它的广阔应用空间。

     Duolingo

一款语言学习类APP,Duolingo 把 GPT-4接入产品,进行角色扮演,让人工智能跟用户去对话,纠正语法错误,并且把这一功能融入产品的游戏化。

eb50cbde639780d9d309e7d7faeba13b.png

     Be My Eyes

这是一款为视力障碍人士提供的产品,其实一直以来大部分的盲人类产品都只能识别文字。现在他们可以借助 GPT-4的图像识别分析来看这个世界。

99317a96be9236aff1ec0556423056ea.png

     摩根士丹利

作为财富管理领域的领导者,摩根士丹利维护着一个内容库,其中包含数十万页的知识,涵盖投资策略、市场研究和评论以及分析师见解。大量的信息分布在许多内部网站上,主要是 PDF 格式,需要顾问浏览大量信息以找到特定问题的答案。这样的搜索可能既费时又麻烦。

借助 OpenAI 的 GPT-4,摩根士丹利正在改变其财富管理人员查找相关信息的方式。

4f22062d30d73491e6e8d20ca68e7656.png

     可汗学院

用来探索 GPT-4在教育中的应用,对特定学生差异化教育,抹平教育资源带来的差距。

可汗学院是一家非营利组织,其使命是为任何地方的任何人提供免费的世界一流教育。该组织为所有年龄段的学生提供数以千计的数学、科学和人文课程。

但是每个学生都是独一无二的,他们对概念和技能的掌握也各不相同——相差很多。有些人可能会轻而易举地学会,而另一些人则需要手把手的帮助。当疫情扰乱了无数的教育系统时,这种差距只会加深。

“考虑到每个人的不同需求,让他们不断进步是一项挑战,”可汗学院的首席学习官 Kristen DiCerbo 说。“他们都处于不同的层次。他们都有不同的差距。他们都需要不同的东西来前进。这是我们长期以来一直试图解决的问题。”

今天,可汗学院宣布将使用 GPT-4 为 Khanmigo 提供支持,Khanmigo 是一种人工智能助手,既可以作为学生的虚拟导师,也可以作为教师的课堂助手。

b9e7cde3468975f76569e8b2c807a41f.png

最后,越来越不OPEN的OPENAI

f1996c4b119fefcb1b6b0c3b23a31aba.png

Openai 在介绍 GPT-4 的 98 页论文自豪地宣称他们 “没有” 披露他们训练集的内容。虽然这并不意外,但是这让大家开始对他们宣称的对安全性的顾虑开始怀疑,这种非常不开放的大模型真的会一直站在巅峰么?永远都没有挑战者么?

目前在语言大模型领域,Openai的 GPT-4 无疑是最强的,但是未来呢?会不会出现一个类似在AI绘画领域的 stable diffusion 来打破这个垄断的局面?

让我们在接下来的一年里拭目以待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38167.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

浅析多模态机器学习

GPT-4的发布给ChatGPT带来了又一次飞跃,ChatGPT不仅支持文字输入,还能看得懂图片、甚至是漫画、梗图,以GPT-4为代表的多模态大模型非常强大。多模态大模型就是指模型可以处理多种结构/类型的数据,例如GPT-4,它既可以处…

GPT-4发布!

GPT-4更能理解“抽象”ChatGPT怎么用?继续往下看 在网上,不少网友对此次ChatGPT的迭代表现的既兴奋又担忧。GPT-4增强了高级推理和处理复杂指令方面的能力,另外,它还具有更多的创造力。OpenAI给出了几个使用范例,如说明…

OpenAI GPT-4震撼发布:多模态大模型

OpenAI GPT-4震撼发布:多模态大模型 发布要点GPT4的新功能GPT-4:我能玩梗图GPT4:理解图片GPT4:识别与解析图片内容怎样面对GPT4 申请 GPT-4 API 前言: 🏠个人主页:以山河作礼。 📝​📝:本文章是帮助大家更加…

1.自动标注工具:CVAT---介绍

1.自动标注工具:CVAT—介绍 简介:CVAT是用于计算机视觉的免费,在线,交互式视频和图像注释工具。可以用于模型训练数据的标注。在线测试网站 这里是在线测试网站 文章目录 1.自动标注工具:CVAT---介绍前言一、效果二、…

标注2.0:数据标注员如何进行从业选择?

作为一个2020年3月份才正式正名的一个岗位,开始就受到了很多关注,但也引发了很多争议。经过几年的发展人工智能很多领域已经落地初见成效,数据标注也逐渐要进入一个“洗牌期”。但很少有人关注从业者的发展,不管是在百度还是知乎去…

Tina_Linux_syslog_使用指南

Tina Linux syslog 使用指南 1 基本介绍 syslog 可以说是一套统一管理系统日志的机制,尤其常用于记录守护进程的输出信息上。因为守护进程不存在控制终端,它的打印不能简单地直接输出到stdin 或 stderr。 使用syslog 时,一般需要关注两部…

Linux外壳程序编程 shell编程 引号详解

shell是命令语言、命令解释程序及程序设计语言的统称; shell是一个命令语言解释器,它拥有自己内建的shell命令; Shell(Bash)单引号、双引号和反引号用法详解; 尽量使用 $(命令) 的方式来引用命令的输出,…

【OS命令注入】常见OS命令执行函数以及OS命令注入利用实例以及靶场实验—基于DVWA靶场

目录 1 OS命令注入概述2 常见OS命令注入函数及例子2.1 system()函数2.2 exec()函数2.3 shell_exec()函数2.4 passthru()函数2.5 popen()函数2.6 反引号结构 3 OS命令注入漏洞的利用3.1 查看系统文件3.2 显示当前路径3.3 写文件 4 OS命令注入漏洞的防御5 OS命令注入漏洞靶场实验…

Linux —— tftp 使用

提示:tftp 命令在 uBoot 系统和 Linux 系统下的使用是不一样的 前言 在 Linux 移植过程或裸机开发中,经常要使用到 tftp 命令,本文围绕该命令相关的网络配置及使用做出记录,本文中,开发电脑命名为上位机,新…

linux 之TFTP的使用

简介 TFTP是用来下载远程文件的最简单网络协议,它其于UDP协议而实现。嵌入式linux的tftp开发环境包括两个方面:一是linux服务器端的tftp-server支持,二是嵌入式目标系统的tftp-client支持。因为u-boot本身内置支持tftp-client,所以…

嵌入式linux与windows之间的tftp文件传输(保姆级)

目录 前言一、为什么要文件传输二、利用共享文件夹(简要流程)三、tftp传输与环境搭建四、传输前的准备工作五、测试准备工作是否完成六、传输文件6.1、windows中tftp32的配置6.2、嵌入式Linux(板子)中获取或发送文件6.2.1、tftp命令用法 前言 在我们接触嵌入式Linux之前&#…

用于医疗领域的聊天机器人ChatDoctor

ChatGPT系列文章 文章目录 ChatGPT系列文章ChatDoctor数据集模型训练参考资料 ChatDoctor ChatDoctor: A Medical Chat Model Fine-tuned on LLaMA Model using Medical Domain Knowledge 论文地址:https://arxiv.org/pdf/2303.14070.pdf 在通用领域中的大型语言…

2021年中国互联网行业投融资运行现状及未来发展趋势分析[图]

互联网指的是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。 一、全球互联网行业投融资运行现状 国际环境更趋复杂严峻,世界经济复苏放缓,通胀压力上升与疫情蔓延交织。2021年…

2021年中国企业风险投资发展现状及未来发展趋势分析[图]

企业风险投资是指有明确主营业务的非金融企业在其内部和外部所进行的风险投资活动。企业从事风险投资的形式主要有两种:一种是把用于风险投资的资金委托给专业的风险投资公司进行管理,由其成立的投资基金根据委托方的战略需要选择投资目标;另…

最强对话模型 ChatGPT 向 Google 搜索发起挑战

GPT-3 发布的两年后,我们没等来它的亲弟弟 GPT-4,而是在今天亲眼见证了 OpenAI 带来了一种全新的 AI 聊天机器人——ChatGPT,也可以称之为是 GPT-3 家族里面的亲戚,它不仅可以解释代码、编写情景喜剧脚本,也可以为用户…

Google 新一代音乐识别

文 / Google AI 苏黎世办公室 James Lyon 2017 年,我们发布了具有闻曲知音功能的 Pixel 2,就是利用深度神经网络为移动设备带来低功耗、始终开启的音乐识别功能。在开发 “闻曲知音” 时,我们的目标是打造一个小巧高效的音乐识别器&#xff0…

谷歌AudioLM :通过歌曲片段生成后续的音乐

AudioLM 是 Google 的新模型,能够生成与提示风格相同的音乐。该模型还能够生成复杂的声音,例如钢琴音乐或人的对话。结果是它似乎与原版没有区别,这是十分让人惊讶的。 为什么生成音乐如此困难? 创作音乐并不是一件容易的事。生成音频信号&…

“程序员交友网站” SO 突然裁员 10%,网友:ChatGPT 出来后就不咋用了

在ChatGPT影响下,知名开发者问答社区Stack Overflow撑不住要裁员了! 随着用户大规模转战ChatGPT,Stack Overflow访问量大幅骤降,且盈利情况不容乐观。 CEO Prashanth Chandrasekar在公开信中坦言:正处于困难时期。 具…

巴比特 | 元宇宙每日必读:浙江发布2023年元宇宙产业发展工作要点,6月底前组建元宇宙产业联盟,年底打造20家“专精特新”企业...

摘要:据浙江省发改委官网 4 月 24 日消息,浙江省发改委等 5 部门近日联合印发《浙江省元宇宙产业发展 2023 年工作要点》。《工作要点》制定了十六项主要任务,并提出在2023 年 4 月底前建立元宇宙部门工作协同机制;6 月底前组建元…

免费版GPT-4!美国AI初创公司推出Forefront Chat,火到官网崩溃

免费版 GPT-4 到底香不香? AI初创企业正式推出Forefront Chat 近日,Forefront AI 正式推出 Forefront Chat,允许用户免费体验 GPT-4 的强大功能。ForeFront AI 是一家总部位于纽约的软件开发公司,联合创始人分别为 Jimmy Grease…