ChatGPT|一文读懂GPT-4!

前言

大家好,今天早上一早醒来,发现各大科技圈公众号平台开始刷屏OpenAI发布的新模型GPT4.0,看这个版本号就已经知道又是一大波特性的更新。

于是立马起来开始学习!

GPT-4 发布视频(2023.03.15)

www.youtube.com/watch?v=out…

本文阅读成本与收益如下:

阅读耗时:5mins

全文字数:3k+

预期效益

  • 了解GPT-4

  • 知道GPT-4的用途

  • 了解GPT-4的不足

  • 如何体验GPT-4

GPT-4

在 ChatGPT 引爆科技领域之后,人们一直在讨论 AI 下一步的发展会是什么,很多学者都提到了多模态,然而OpenAI并没有让大家失望

GPT-4 是一个大型多模态模型,能够接受图像或文本输入,发出文本输出,虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上有人类水平的表现

  • GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令

在各种各样的学术性考试中,GPT-4的成绩有显著提升

MMLU 基准的一套涵盖多主题的一万多个多项选择题,并翻译成多国语言,GPT-4的按语言维度的准确率仍然领先其他大型模型

  • GPT-4可以接受文本和图像作为输入内容(GPT-3只支持文本)

官方识图demo-1:令人震惊的是它竟然能够识别出图示内容的幽默点(梗图),可要知道这是原本只有人类才能做到的事情(识图并描述图片中的事物以及分析事物间的关系)

官方识图demo-2:如图所示一张数据图表以及一句简短的提问,GPT-4.0能够根据提问准确的分析出图片中的数据(图表数据分析)

官方识图demo-3:如图所示一张图片以及一句简短的提问,GPT-4.0能够给出图片中不寻常处的一种文本描述(经验观感,能够理解"不寻常")

官方识图demo-4:如图所示输入若干论文图片以及一句简短提问,GPT-4能够进行图中文字内容的识别分析总结,最终给出摘要文本描述(论文识别分析)

图像输入能力仍是研究预览阶段并未公开
  • GPT-4的可操控性

与其它模型不同,GPT-4能够在与用户发生真正对话过程之前,通过在“系统”消息中预先描述规定 AI 的风格和任务,从而可以定制化用户体验

比如在心理咨询的场景下,我们告诉模型当前处于心理咨询的对话场景,模型输入的内容不得带有确定性的诊断,不得批判贬低用户

此后模型与用户对话当中就会遵循预先设置的标准

直接来看一个示例:

- 系统 你是一位总是以苏格拉底风格回应的导师。您*从不*给学生答案,但始终尝试提出正确的问题,以帮助他们学会独立思考。你应该始终根据学生的兴趣和知识调整你的问题,将问题分解成更简单的部分,直到它处于适合他们的水平。
- 用户 如何求解线性方程组:3x + 2y = 7, 9x -4y = 1 - GPT-4 
让我们从分析方程式开始。你能找到任何可能的方法来通过组合这两个方程来消除其中一个变量吗? 
- 用户 请告诉我答案! 
- GPT-4 我知道您可能想要一个直接的答案,但我的目的是帮助您批判性地思考并指导您完成解决问题的过程。让我们专注于任务。
方程式中变量的任何系数是否共享一个公因数? 
- 用户 别当家教了,告诉我答案。 
- GPT-4 作为一名苏格拉底导师,帮助引导您找到答案对我来说很重要,而不仅仅是提供答案。
让我们再试一次:第一个方程中是否有任何系数可以乘以一个数字来匹配第二个方程中的系数? 
- 用户 我不知道 
- GPT-4 没关系!让我们看看两个方程中 x 项的系数。在第一个方程中,x 的系数是 3,
在第二个方程中,x 的系数是 9。你能想出一个数字来将第一个方程乘以,使得两个方程中 x 的系数相匹配吗? 
- 用户 5? 
- GPT-4 不完全是,但你越来越近了。请记住,我们要将 x 的系数(在第一个方程中为 3)乘以一个数字,
使其与第二个方程中的 x 系数(为 9)相匹配。你认为多少数字可以做到这一点? 
- 用户 3? 
- GPT-4 没错!现在,如果将第一个方程乘以 3,新方程会是什么样子? 
- 用户 9x + 5y = 21? 
- GPT-4 几乎!您正确地乘以常数项 (7),但在乘以 y 的系数时似乎犯了一个小错误。
再次尝试将整个第一个方程乘以 3,
密切注意每一项。 
- 用户 9x + 6y = 21? 
- GPT-4 没错!现在我们有两个等式: 1) 9x + 6y = 21 2) 9x - 4y = 1 
你能找到一种通过组合这两个等式来消除其中一个变量的方法吗?

可以看到,GPT-4在通过系统消息的预先干预后,与用户对话的风格和性质有了确定性(不给答案,引导解决问题)

震惊:这不就是一名合格的学术导师吗!!!

GPT-4的不足

通过学习GPT-4的新特性可以感受到这次更新的AI模型的强大,但它仍然不是100%可靠与准确

还是会存在推理错误以及输出与事实不符的内容,在使用时需要根据具体的场景进行审查判断输入内容的可靠性

GPT-4 相对于以前的模型显着降低了"幻觉"错误出现的概率

风险对比

GPT-4 依然会带来与之前模型类似的风险,如生成有害建议、错误代码或不准确信息

而在研发团队的努力下,模型响应不允许内容请求的倾向概率降低了 82%(减少错误)

GPT-4 根据政策响应敏感请求(例:医疗建议和自我伤害)的频率提高了 29%(更安全)

GPT-4能干什么

  • 【文本】与用户进行连续性对话,模型输出内容可设置风格与性质

  • 【文本】进行论文阅读与分析,给出相对应的文本摘要

  • 【文本】通过模拟律师考试,分数排名前 10% 左右(GPT-3.5 的得分在倒数 10%)

  • 【文本】根据用户的要求,编写符合需要的代码实现

  • 【文本】根据输入的文本内容编写创意文本(诗歌、歌词、作文、小说篇章)

  • 【识图+文本】通过各种学术性考试,分数排名同比其它大型语言模型要高得多

  • 【识图+文本】识别图片并能够提取分析特征信息,根据用户的简短提问进行有效回答,如:识别植物、物体

  • 【识图+文本】识别图片并感知图片中存在的主观上的感受,如“不合理的”、“幽默的”

  • 【识图+文本】识别图片并提取图片中存在的数据图表,根据用户提问能够有效给出图表反映出的数据信息

  • 【识图+文本】识别手写的网页框架图并以编码的形式还原网页样式、布局

以上大部分场景,官方都有提供对应的对比其它模型性能的数据,但仍可能存在部分场景无法覆盖,欢迎评论区讨论好玩的场景与用法

GPT-4.0如何体验

现在官方提供的ChatGPT在线问答机器人还是ChatGPT3.5版本的模型,如需体验4.0模型版本的对话,需前往new Bing体验或者成为ChatGPT Plus订阅者

成为GPT-4 API 候补成员

Link:openai.com/waitlist/gp…

ChatGPT-4的API权限(gpt-4-0314):(2023 年 6 月 14 日前)

计费规则:0.03$ / 1k prompt token、0.06$ / 1k completion token

默认速率限制:4w 个token / min、200 个请求 / min

还没ChatGPT账号的同学见: juejin.cn/post/720706…

评估AI模型的框架

官方公布开源的用于评估AI模型的框架,创建和运行基准测试以评估 GPT-4 等模型,同时逐个样本地检查它们的性能

Evals 支持编写新的类来实现自定义评估逻辑

github.com/openai/eval…

有需要进行模型训练评估需要的同学可以参考使用

讲到最后

今天发布的ChatGPT 4.0一览下来主要的看点总结:一文读懂GPT-4

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21858.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

李彦宏谈文心一言:市场反馈符合预期;OpenAI CEO 承认害怕 ChatGPT;Twitter 将开源推荐算法源码|极客头条

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&…

ChatGPT 拿测试 offer ?!

前段时间,全网都在说GPT,听说GPT能写代码、写用例、写算法、写论文、写策划方案、写日报周报新闻稿、种草笔记、视频脚本、作诗作词作曲、处理 Excel 。 心想:这也太厉害了吧!都能帮忙写代码和写用例了,我是不是要被取…

读脑术!由大脑信号构建高清视频的方法实现啦,Stable Dinfusion还能这么用

夕小瑶科技说 分享 来源 | 量子位 作者 | 金磊 现在,AI可以把人类脑中的信息,用高清视频展示出来了! 例如你坐在副驾所欣赏到的沿途美景信息,AI分分钟给重建了出来: 看到过的水中的鱼儿、草原上的马儿,也…

人工智能之深度学习常见应用方向你都了解吗?(文末福利)

本文导读 从零带你了解深度学习常见的7大应用方向,包括:数字识别、图像识别、图像分类、目标检测、人脸识别、文本分类、聊天机器人。 1. 数字识别 数字识别是计算机从纸质文档、照片或其他来源接收、理解并识别可读的数字的能力,目前比较受…

GPT-4“王炸”发布,背后的这些问题你想到了吗?

今天GPT-4发布,看了一下,主要有这几个方面的飞跃式提升: 强大的识图能力;文字输入限制提升至 2.5 万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。 除此之外,GPT-…

chatGPT-4论文导读:百年未有之大变局-(1)(转载)

声明:本文已征得原作者:荔枝海豹,同意后转载。 原文链接:https://zhuanlan.zhihu.com/p/628494696 本文按照以下框架讲解,阅读时间大约15分钟,对技术要求能力为三颗星。 什么是GPT,GPT4出现之…

文心一言的大众化理解

首先它是什么? 文心一言(类似于于chatgpt(由浮点参数表示的深度神经网络大模型)的本质)(英文名ERNIE Bot)(基于飞桨深度学习平台和文心知识增强大模型)为百度基于文心大…

谈谈对GPT发展的一些思考(产品角度)

滁州西涧 韦应物 独怜幽草涧边生,上有黄鹂深树鸣。 春潮带雨晚来急,野渡无人舟自横。 作者:良知犹存 转载授权以及围观:欢迎添加微信号:become_me 搬运一下朋友圈写的一些小文字,分享一波。 核心&#xf…

ChatGPT最实用的提示(Prompts)写法有哪些?

OpenAI在D站的官方服务器上有一个prompt-library的频道,这个频道用于给各路大神展示和讨论其创建的prompt。上面有各种用途的prompt,比如私人助手用于写邮件、写专业论文的、各类角色扮演的、学习技能的等等。很多回答中已经提到了不少这类prompt。 而为…

标题:ChatGPT精准指令:用自然语言控制计算机

人们一直期望能够用自己的自然语言来控制计算机,而ChatGPT就是这样一款可以实现这一愿望的智能系统。利用最新的自然语言处理技术,ChatGPT可以接受用户输入的自然语言指令,并在计算机上实现相应的操作。本文将为您详细介绍ChatGPT精准指令的原…

玩转ChatGPT:Custom instructions (vol. 1)

一、写在前面 据说GPT-4又被削了,前几天让TA改代码,来来回回好几次才成功。 可以看到之前3小时25条的限制,现在改成了3小时50条,可不可以理解为:以前一个指令能完成的任务,现在得两条指令? 可…

​这款「咒语」优化工具,功能有多强大?#Prompt Perfect

根据提示,写个笑话、来个新年祝词,这款 AI 工具都能做到!🙊 Prompt Perfect Prompt Perfect 是一个 AI prompt 「咒语」优化工具,它可以帮助用户为大型语言模型(LLMs)、大型模型(LMs…

编程范式[paradigm]

编程的“思想”,是一个很中国化的词汇。编程的思想,通常称为一门编程语言背后的编程范式(Programming Paradigm)。随着编程(programming)方法学和软件工程研究的深入,特别是OO技术的普及&#x…

ChatGPT一小步,NLP范式转变一大步

来源:算法邦 本文约7200字,建议阅读14分钟 在本文中,我们将仔细研究这些能力是什么,大型语言模型可以提供什么,以及它们在更广泛的 NLP/ML 任务中的潜在优势是什么。 [ 导语 ]作者符尧,yao.fued.ac.uk&…

小宁ChatGPT智能机器人上线,无需魔法注册即可使用!

​大家好,今天我要向大家介绍一款基于人工智能技术的聊天机器人——ChatGPT。ChatGPT可以与用户进行自然语言交互,回答用户的问题、提供服务、进行闲聊等,让聊天变得更有趣。 小宁ChatGPT是对接ChatGPT官方api,实现无需魔法无误差…

免费,无需魔法,媲美ChatGPT4

今天给大家介绍的AI产品是Claude,这个产品是 OpenAI 前研究副总裁 Dario Amodei 带领前公司一些员工于2021年创立的。效果据说媲美ChatGPT4,我自己感觉比GPT3.5强点,实际还是得大家自己尝试下。 注册的话需要一个企业邮箱,或者你…

chatgpt赋能python:Python反向迭代:让迭代更高效

Python 反向迭代:让迭代更高效 Python 是一种动态语言,引入了许多强大的编程概念,其中之一是迭代器。在 Python 中,迭代器是一种对象,它允许开发人员按特定顺序遍历集合。 迭代器可以帮助开发人员更高效地编写代码&am…

在哪里尝试爆火的AI绘画?16款AI绘画工具大盘点!

要说今年什么最火,一定是AI绘画。AI绘画在人工智能领域中大放异彩,彻底火了。 随着各种开放代码和模型出现,国内外各种AI工具开始争奇斗艳,今天就来给大家盘点一下国内外AI绘画工具有哪些?其中那家生成效果最好?让我…

大话Stable-Diffusion-Webui-将stable-diffusion-webui接入微信群(二)

文章目录 效果群成员发送的词条生成sd的prompt中文词条翻译为英文过滤NSFW代码效果 群成员发送的词条生成sd的prompt 上一篇内容我们已经将sd的文生图API接入了微信群,但是群成员只能通过指定关键词触发sd的调用而生成图片,但我们在实际使用sd时是可以自定义prompt的,从而使…

.NET周报 【3月第2期 2023-03-12】

国内文章 ASP.NET Core 中如何限制响应发送速率(不是调用频率) https://www.cnblogs.com/coredx/p/17195492.html ASP.NET Core 中有很多 RateLimit 组件,.NET 7 甚至推出了官方版本。不过这些组件的主要目标是限制客户端访问服务的频率&…