OpenAI 发布GPT-4——全网抢先体验

OpenAI 发布GPT-4

最近 OpenAI 犹如开挂一般,上周才刚刚推出GPT-3.5-Turbo API,今天凌晨再次祭出GPT-4这个目前最先进的多模态预训练大模型。与上一代GPT3.5相比,GPT-4最大的飞跃是增加了识图能力,并且回答准确性也得到显著提高。GPT-4在多个专业和学术基准测试中展现出令人印象深刻的表现,有时甚至达到了人类水平。GPT-4 的关键特性之一是它能够理解和分析视觉和文本信息。通过结合这些模式,该模型能够对各种任务生成更准确、更细致的回答,例如图像说明或问题回答。此外,GPT-4 能够从大量数据中学习,并适应不同的上下文,使其成为自然语言处理、计算机视觉和机器学习等许多领域中非常有价值的工具。

文章目录

  • OpenAI 发布GPT-4
    • GPT-4的能力
    • 对GPT-3.5错误的修正
      • 链式推理
      • 逻辑谬误
      • 数学能力
    • 如何访问GPT-4
    • 总结

GPT-4的能力

img

虽然GPT-4是在其前身GPT-3.5的基础上升级而来,但是一些微妙的差异使得GPT-4可能颠覆整个游戏规则。

第一眼看上去,在一些随意交谈中很难看出GPT-3.5和GPT-4之间的区别。然而,当你让模型完成一些复杂的任务时,区别就显现出来了。GPT-4比GPT-3.5更可靠、更具创造力,并且能够处理更细微的指令。GPT-4最令人印象深刻的功能之一是它能够理解上下文并生成与当前情况更相关的响应。例如,如果你问它一个关于特定主题的问题,它能够考虑到对话的背景,并提供一个更准确和合情的答案。GPT-4的另一个显著改进是它的创造力。它可以对提示产生更具想象力和独创性的响应,使其成为作家、艺术家和任何想要挖掘其创造性一面工作者的绝佳工具。

img

我们具体看看 GPT-3 和 GPT-4 之间令人兴奋的区别,下图是 GPT-3 和 GPT-4 在各种基准测试中的表现对比:

img

从测试数据上看,GPT-4 比 GPT-3 整体好40%,在超过一半的测试中 GPT-4 比 GPT-3 有飞跃性进步。

再给大家看一个我个人认为很神奇的案例:给出食材,让GPT-4食谱。

img

上面案例展示了GPT-4良好的图像理解能力。

对GPT-3.5错误的修正

之前ChatGPT在很多问题上表现并不理想,为此我专门针对ChatGPT过去表现不佳的问题以及我关注的使用场景对GPT-4做了专门测试。

链式推理

GPT-3.5在一些非常复杂的问题,需要多条推理链的问题上,经常会要求提供更多信息。而GPT-4明显改进链式推理能力,在多推理链问题上表现良好。

GPT-3.5

在这里插入图片描述

GPT-4

在这里插入图片描述

逻辑谬误

GPT-3.5经常会在一些简单问题上犯逻辑错误,出现这种问题一般是由于问题中夹杂着一些无用的干扰项,比如:”蓝盒子里有一个苹果,蓝盒子里还有一个红盒子,红盒子有个盖子,请问我要如何取出苹果?“。其中”红色盒子有个盖子“就是无用干扰信息,GPT-3.5会给出完全荒谬的回答:

GPT-3.5
在这里插入图片描述

而GPT-4可以给出相对合理的答案,且很清楚地说明并避开了问题中的陷阱。

GPT-4
在这里插入图片描述

数学能力

GPT-3.5的数学能力广受诟病,甚至在一些简单的小学数学题上频频出错。比如:”我今年6岁,妹妹年龄是我的一半。那么当我90岁时,妹妹多少岁?“

GPT-3.5
在这里插入图片描述

GPT-3.5煞有介事的一步一步推理计算,最后给出45岁的错误答案。而GPT-4则修正了这方面的缺陷:

GPT-4
在这里插入图片描述

如何访问GPT-4

目前,ChatGPT Plus 会员可以通过 chat.openai.com 访问 GPT-4,但有使用上限。

在这里插入图片描述

在进入ChatGPT界面后,用户可以选择使用的模型。有3个模型可以选择

在这里插入图片描述

OpenAI很贴心的用直观可视化的方式对比了三个模型。

在这里插入图片描述

从官方给出的功能性能对比指引可以看出,GPT-4在推理能力和简明扼要方面明显由于GPT-3.5。

GPT-4的API与GPT-3.5的接口一致,不过目前需要申请开放。我已经第一时间加入了waitlist,等审批通过后再位大家带来GPT-4的接口使用体验报告。

在这里插入图片描述

总结

总的来说,GPT-4在推理能力上比GPT-3.5进步巨大,很多之前的问题都得到了修正和改良。我还没有测试GPT-4的多模能力,后面我会继续进行更多的测试,并即时更新文章分享给大家。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33320.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT-4正式发布!如何访问 怎么免费使用GPT-4?

美国人工智能研究实验室OpenAI,周二为其爆红聊天机器人ChatGPT发布了最新GPT-4语言模型,这距离ChatGPT的上线仅仅过去了4个月时间。 和ChatGPT最初使用的GPT-3.5模型相比,GPT-4实现了几个方面的飞跃式提升:强大的识图能力&#x…

谷歌Bard最新更新:支持中文,还升级了ChatGPT都没有的识图功能

夕小瑶科技说 原创 作者 | 智商掉了一地、ZenMoore 两个月前咱们刚盘点完 Bard 的大更新,在那两周中,谷歌将全家桶和 Bard 联动不久,还推出了十大新功能,当时他们就在博客更新中提到,会在今年夏天新增对中文等另外 40…

GPT-4来炸场:10秒输出一个网站,识图知意 so easy,为何如此丝滑

比被卷更可怕的莫过于自己卷自己,这点还得是OpenAI更胜一筹。 四个月前,ChatGPT 刚刚推出,并成为历史上增长最快的消费者应用程序。在ChatGpt大杀四方时,万众瞩目的大型多模态模型GPT-4也在今天凌晨正式发布。 据OpenAI官方介绍&…

使用GPT-4生成QT代码

一、概述 最近ChatGPT火爆起来了,ChatGPT是一种基于GPT的自然语言处理模型,可以用于生成自然语言文本,例如对话、文章等。最近又发现了一个优秀且免费的代码生成工具Cursor ,Cursor集成了 GPT-4 ,可以帮助你快速编写、…

chatgpt赋能python:Python如何查看图片

Python如何查看图片 在SEO优化中,图片也是至关重要的一部分。而在Python中,我们可以使用一些代码来查看图片。下面就来介绍一下Python如何查看图片的方法。 1. 安装Python相关库 要使用Python查看图片,需要先安装一些相关的库。常用的库包…

ChatGPT之后,垂直大模型兴起

由ChatGPT掀起的这一波大模型浪潮中, 百度、阿里等大厂相继下场,王慧文、王小川、李开复等大佬也纷纷入场。年初,比尔盖茨高呼“人工智能时代已经开始”,给大模型定下了宏伟的基调。随着竞争的展开,大模型已不是“是否”问题&…

大佬下场AI2.0,我们帮“王慧文们”指条明路

划重点: 1、如果将开发大模型比做是“造房子”,那AI Infra 就是“工具箱”,而中国缺少的正是工具和原材料制造工厂。 2、根据国外市场的情况,可以将整个AI Infra大致分为数据准备、模型构建、模型产品三个层面,在这三…

win10系统提示 “你的账户已被停用,请向系统管理员咨询” 如何解决 ?

今天有位朋友,可以是不知道是为了寻求刺激,还是刷存在感, 把自己的win10系统管理员账号 Administrator 将用户给禁用了,并且注销完开机后,就是电脑突然提示“你的账户已被停用,请向系统管理员咨询”如图 : 解决方法 此情况可以长按电源键强制关机再开机…

google账号已停用(已解决)

很久没登陆Google邮箱了 近期想使用google diver发现账号被停用了 进行申请,但是一直没恢复 记录一下解决方法: 1、手机上下载谷歌邮箱和商店 2、科学进入谷歌邮箱 我是想再创建一个号的,在创建的过程中,app提示我已经有一个谷…

程序员兼职社区招募,需要技术能力强,博主粉丝皆可参与发展副业

程序员兼职社区招募 1. 机会多多2. 技术方向3. 要求4. 最后 1. 机会多多 2. 技术方向 技术方向主要为:Python,MATLAB,深度学习,语义分割 ,机器视觉,知识图谱 ,强化学习,三维点云&…

2023该好好赚钱了,推荐三个下班就能做的副业

在过去的两年里,越来越多的同事选择辞职创业。许多人通过互联网红利赚到了他们的第一桶金。随着短视频的兴起,越来越多的人吹嘘自己年收入百万,导致很多刚进入职场的年轻人逐渐迷失自我,认为钱特别容易赚。但事实上,80…

做什么副业比较赚钱,这五个项目现在入行可能比上班挣得还多

还有2个月不到的时间,2022就要过去了,这一年太魔幻了,而普通人的生活也的确太难了! 这一年,各行各业都在萎缩,制造业急剧萎缩,要么不能静态生产,要么生产了就送不出去,因…

简单易学的网上副业,能帮你减轻压力的六个副业

现在经济环境很差,大多数上班族生活不好,要么遇到行业低谷收入急剧下降,要么公司管理不善成为失业军队的一员,底层人民生活困难,但为了孩子有一个良好的成长环境,为了让他们掏空父母的积蓄买房子不被银行拿…

三个可长期发展的网络副业,稳定的兼职渠道,不再为网络做苦力

绝大多数互联网从业者,实际上脑中想得仅有一件事,没脑子的打金月入破万,不否认这类第二职业也是有,但是也是必须必要条件的,你必须早期非常辛苦,后边才可能保证大批量躺着赚钱,而与一开始就听话…

ChatGLM-6B模型微调实战(以 ADGEN (广告生成) 数据集为例,序列长度达 2048)

kingglory/ChatGLM-6B 项目地址 1 介绍 对于 ChatGLM-6B 模型基于 P-Tuning v2 的微调。P-Tuning v2 将需要微调的参数量减少到原来的 0.1%,再通过模型量化、Gradient Checkpoint 等方法,差不多需要 7GB或则8GB 显存即可运行。 2 环境 2.1 python …

告别至暗时刻,高端与全系列手机市场前景可期

作者|落笔 近年来,智能手机用户换机周期持续拉长,市场出货量逐年走低,IDC数据显示,2022年全年中国智能手机市场出货量约2.86亿台,同比下降13.2%,创有史以来最大降幅,全球智能手机发展已进入成熟…

【智能座舱】— 看上海车展,高端品牌变局,时代变天早开始,40项智能化创新技术解密~

大家好,欢迎阅读本期文章,我们将带您解读一份极具实用价值的汽车研究报告。本期将聚焦于2023年上海车展,解密未来座舱发展技术脉络 在本期文章中,我们将深度探讨这些前沿技术的应用,为您呈现未来汽车的全景图。我们相信,这将有助于您更加准确地选择适合自己的新能源汽车…

2023年,产业互联网八大趋势

从全世界的TO B发展线来看,中国的TO B企业不是脚步最快的,但它们却也正在通过汲取中国数字经济高速发展的养料不断成长,同时主动下沉,成为新的产业数字化的底盘,做撑举起未来数字中国的无名力量。 作者|皮爷 出品|…

同样是做大模型的科技公司,为啥差距这么大呢?

2022年OpenAI亏了30多亿元, 站在风口上,谁的压力会小呢? 【科技明说 | 每日看点】站在风口上。OpenAI公司在2022年亏得十分“灿烂”,和往年同比几乎翻了一倍,亏损约达5.4亿美元,折合人民币约31…

AI无处不在,科技改变生活:开放原子全球开源峰会参会感悟

目录 前言 英特尔的开源之路 拥抱人工智能 AIGC的浪潮之巅 全链路AI解决方案 极致性能优化 结束语 前言 2023年开放原子全球开源峰会 目前中国源代码贡献量已达到世界第二,开源软件开发者数量也已突破800万,居全球第二。在众多开发者的关注下&…