宇宙最强-GPT-4 横空出世:最先进、更安全、更有用

文章目录

  • 前言
  • 一、准确性提升
    • 1.创造力
    • 2.视觉输入
    • 3.更长的上下文
  • 二、相比于ChatGPT有哪些提升
    • 1.GPT-4 的高级推理能力超越了 ChatGPT
    • 2.GPT-4 在多种测试考试中均优于 ChatGPT。
  • 三、研究团队在GPT-4模型都做了哪些改善
    • 1.遵循 GPT、GPT-2 和 GPT-3 的研究路径
    • 2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。
    • 3.安全与对齐:
  • 四、和一些开发创新产品的组织合作
  • 五、其他
    • 详细研究报告
    • 基础设施:
    • 局限性
    • 可用性
  • 总结


前言

昨晚OpenAI公开了GPT-4的进展,并可以基于ChatGPT实现GPT-4的使用和访问。博主连夜总结出以下Xmind,那么GPT-4到底有哪些巨大的能力提升呢,让我们来一探究竟!【如需进一步交流,请私信】
在这里插入图片描述


一、准确性提升

GPT-4 可以更准确地解决难题,这要归功于其更广泛的常识和解决问题的能力。
GPT能力提升主要在三个方面:

1.创造力

在这里插入图片描述

如上图所示,是OpenAI官网展示的一个例子,这里我人肉翻译了下:
Input

用一个句子解释灰姑娘的情节,其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头,> 不重复任何字母。

Output

美丽的灰姑娘充满热切地生活,最终找到了幸福;她激发了嫉妒的亲戚们,神奇的爱情滋养着富有的王子;她悄悄地拯救了他,水晶鞋取得胜利,奇妙地将他们紧密团结在一起,这对热情洋溢的年轻人友好相处。

从上述例子汇总我们可以发现,GPT-4 比以往任何时候都更具创造性和协作性。官网说它可以生成、编辑并与用户一起迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。

2.视觉输入

GPT-4还支持视觉输入
在这里插入图片描述
在这里插入图片描述
上面给出了一个例子:我可以用这些原料干什么,随后给出一张鸡蛋、面粉、奶油的图片。GPT-4给出如下回复:

Output

有很多种方法可以用这些食材制作美食!以下是一些可能的选择:

  • 煎饼或华夫饼
  • 可丽饼
  • 法式吐司
  • 煎蛋卷或意式烘蛋
  • 蛋奶酥或布丁
  • 蛋糕或纸杯蛋糕
  • 松饼或面包
  • 饼干或饼干
    这只是其中的一些例子,但可能性是无穷无尽的!

这回复简直太赞了!

3.更长的上下文

在这里插入图片描述
GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。

二、相比于ChatGPT有哪些提升

1.GPT-4 的高级推理能力超越了 ChatGPT

在这里插入图片描述
Input

安德鲁从上午11点到下午3点有空,乔安娜从中午12点到下午2点,然后从下午3点半到5点有空。汉娜在中午12点有半小时空闲,然后在下午4点到6点有空。对于安德鲁、汉娜和乔安娜来说,安排一场时长30分钟的会议,有哪些开始时间的选项?

ChatGPT Output

以下是他们的空闲时间列表:

  • 安德鲁:上午11点至下午3点
  • 乔安娜:中午12点至下午2点,下午3点半至5点
  • 汉娜:中午12点至12点半,下午4点至6点
    根据他们的空闲时间,有一个30分钟的时间窗口,这三个人都有空,即下午4点至4点半。所以,会议可以安排在下午4点

GPT-4 Output

安德鲁:上午11点 - 下午3点
乔安娜:中午12点 - 下午2点,下午3点半 - 下午5点
汉娜:中午12点 - 12点半,下午4点 - 下午6点
可以安排30分钟会议的共同空闲时间:中午12点 - 12点半

2.GPT-4 在多种测试考试中均优于 ChatGPT。

在这里插入图片描述
在统一律师考试中,ChatGPT排名在倒数10%内,而GPT-4或者了前10%的好成绩,而在生物奥林匹克考试中,GPT-4的领先更加夸张,或者排名前1%的好成绩,而ChatGPT才排31名。


三、研究团队在GPT-4模型都做了哪些改善

1.遵循 GPT、GPT-2 和 GPT-3 的研究路径

我们的深度学习方法利用更多数据和更多计算来创建越来越复杂和强大的语言模型。

2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。

在我们的内部评估中,与 GPT-3.5 相比,GPT-4 响应不被允许内容请求的可能性低 82%,产生事实响应的可能性高 40%

3.安全与对齐:

  • 1.通过人工反馈进行训练(人工+专家反馈)
    • 我们纳入了更多的人工反馈,包括 ChatGPT 用户提交的反馈,以改进 GPT-4 的行为。我们还与 50 多位专家合作,在 AI 安全和保障等领域获得早期反馈。
  • 2.从现实世界的使用中不断改进(现实世界反馈)
    • 我们已经将我们以前模型在现实世界中使用的经验教训应用到 GPT-4 的安全研究和监控系统中。与 ChatGPT 一样,随着越来越多的人使用它,我们将定期更新和改进 GPT-4。
    1. GPT-4 辅助的安全研究(自己使用)
    • GPT-4 的高级推理和指令遵循能力加快了我们的安全工作。我们使用 GPT-4 帮助创建用于模型微调的训练数据,并在训练、评估和监控过程中迭代分类器。

四、和一些开发创新产品的组织合作

  • Duolingo:一种对话类应用
  • Be My Eyes:使用GPT-4提高视觉能力
  • Stripe:使用GPT-4简化用户体验并打击欺诈
  • Morgan Stanley:使用GPT-4来管理公司内部知识库
  • Khan Academy:在试点项目中探索GPT-4的潜力
  • Government of Iceland:使用GPT-4保护本土语言
  • Etc.

五、其他

详细研究报告

https://openai.com/research/gpt-4

基础设施:

GPT-4 在 Microsoft Azure AI 超级计算机上接受过训练。Azure 的 AI 优化基础架构还使我们能够向世界各地的用户提供 GPT-4。

局限性

GPT-4 仍然有许多我们正在努力解决的已知局限性,例如社会偏见、幻觉和对抗性提示。随着社会采用这些模型,我们鼓励并促进透明度、用户教育和更广泛的人工智能素养。我们还旨在扩大人们在塑造我们的模型时的输入途径。

可用性

我们在 ChatGPT Plus 上提供 GPT-4,并作为开发人员构建应用程序和服务的 API。

总结

GPT-4的横空出世将ChatGPT的很多局限性突破了,虽然基础模型能力只有一点提升(官方团队谦虚之语),但是在各种测试中GPT-4都完爆ChatGPT了,如果想了解更多内容或者加入到AIGC&ChatGPT的研究交流中可以私信我!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8398.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT五分钟写完插件,功能完善,还可加需求改BUG

开发者(KaiFaX) 面向全栈工程师的开发者 专注于前端、Java/Python/Go/PHP的技术社区 詹士 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT写代码,水平究竟如何? 不到5分钟,做出一个WordPress(一款内容管理系统…

ChatGPT无限可能性:自然语言生成的奥秘

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ! ChatGPT无限可能性:自然语言生成的奥秘 数字化时代:跨越语言和文化障碍 冰岛是北大西洋中部的一个岛国,拥有充满活力的科技产业和…

太香了!用chatGPT写正则

chatGPT热度一直持续不下,我们普通人能做什么? 当然是先用起来,和自己工作结合起来,提高效率。 日常工作中正则使用少不了,可以让gpt来写正则,再也不用去小度查了。 今天推荐下朋友开发的gpt 正则工具&…

一个评测模型+10个问题,摸清盘古、通义千问、文心一言、ChatGPT的“家底”!...

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 毫无疑问,全球已经在进行大模型的军备竞赛了,“有头有脸”的科技巨头都不会缺席。昨天阿里巴巴内测了通义千问,今天华为公布了盘古大模型的最新进展。不久前百度公布了文心一言、360也公布…

【前沿技术】问答pk【ChatGPT Vs Notion AI Vs BAT AI 】

目录 写在前面 问题: 1 ChatGPT 1.1 截图 ​1.2 文字版 2 Notion AI 2.1 截图 2.2 文字版 3 BAT AI 3.1 截图 3.2 文字版 总结 序言 所有幸运和巧合的事,要么是上天注定,要么是一个人偷偷的在努力。 突发奇想,问三个…

前京东AI掌门人周伯文入局ChatGPT,亲手创立的衔远科技获天使轮融资数亿元!

日前,全球领先的专注于企业创新数智化的技术服务公司衔远科技宣布已经完成数亿元天使轮融资,本轮融资由启明创投领投,经纬创投跟投。 衔远科技成立于2021年底,致力于让每一件商品都应需而生,让每一位消费者都得偿所愿。…

前京东AI掌门人入局ChatGPT!「不设上限」招揽中国OpenAI合伙人

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI4 又一技术大牛官宣入局ChatGPT。 这一回出手的,是被视作“京东AI开创者”的前京东高级副总裁,周伯文。 就在2月26日晚间,周伯文在朋友圈广发“英雄帖”,称“现不设上限诚招合伙人”&#…

AI落地:程序员如何用AI?

对于程序员来说,真正能提高效率、可落地的AI应用场景都有哪些? 目前已经能切实落地,融入我日常工作生活的有以下几个场景: 开发工作:自然语言生成代码,自动补全代码 日常工作学习:写作、翻译、…

我的周刊(第079期)

我的信息周刊,记录这周我看到的有价值的信息,主要针对计算机领域,内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。 🎯 项目 ChatGPT 项目推荐 基于 ChatGPT 相关接口衍生的项…

中小学教师ChatGPT的23种用法!

中小学教师ChatGPT的23种用法! 近日,ChatGPT引发舆论风暴,火遍全球。作为一款生成式人工智能软件,ChatGPT可以就任何议题生成文本,完成包括回答问题,撰写文章、论文、诗歌在内的多种工作。各界盛赞其“有着…

【软件架构思想系列】分层架构

目录 架构思维概述 “分解+集成” 可以理解为架构最核心的思考方式和方法。

K8S 生态周报| 别慌,DockerHub 不会清退开源组织和开源项目

“ 「K8S 生态周报」内容主要包含我所接触到的 K8S 生态相关的每周值得推荐的一些信息。欢迎订阅知乎专栏「k8s生态」[1]。 ” 大家好,我是张晋涛。 DockerHub 将停止个人免费版 Team 的功能 想必很多人都用过 DockerHub,Docker 刚面世的时候&#xff0c…

ChatGPT,太爆了!

大家好啊,我是了不起,一个热爱开源的程序员~ 自从去年 ChatGPT 刚刚推出的时候,我们团队就上手体验过,当时就让我感觉到非常的震惊:使用好她,绝对能将工作效率提升好几倍! 这是当时做的几个小测…

AIGC技术周报|清华、北邮新研究:让文生图AI更懂你

AIGC通过借鉴现有的、人类创造的内容来快速完成内容创作。ChatGPT、Bard等AI聊天机器人以及DallE 2、Stable Diffusion等文生图模型都属于AIGC的典型案例。「AIGC技术周报」将为你带来最新的paper、博客等前瞻性研究。 OpenAGI:当大模型遇见领域专家 “愿原力与大型…

2022.2.26 第十五次周报

文章目录 前言一、论文阅读《Interactive Learning from Policy-Dependent Human Feedback》摘要IntroductionRelated WorkPolicy-dependent反馈Convergent Actor-Critic by Humans (COACH)The Advantage Function and FeedbackConvergence and Update Rule ExperimentConclusi…

大模型论文周报 | 来自MIT、哥伦比亚大学、港科大、斯坦福、普林斯顿大学等机构前沿论文研究...

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 大模型又可以称为Foundation Model模型,模型通过亿级的语料或者图像进行知识抽取,学习进而生产了亿级参数的大模型。大模型的出现迎来了AI研究的新时代,其所带来的结果提升十…

AIGC技术周报|ChatDoctor:哪里不舒服;HuggingGPT:连接大模型和机器学习社区;ChatGPT真的鲁棒吗?

AIGC通过借鉴现有的、人类创造的内容来快速完成内容创作。ChatGPT、Bard等AI聊天机器人以及DallE 2、Stable Diffusion等文生图模型都属于AIGC的典型案例。「AIGC技术周报」将为你带来最新的paper、博客等前瞻性研究。 1.ChatDoctor:哪里不舒服? 通用领…

实现短信验证码登录

文章目录 在开发短信验证码接口验证码实体SmsCode手机验证码发送接口手机验证码生成接口不拦截短信验证码路径登录页面测试重构校验码处理接口 ValidateCodeProcessor,封装不同校验码的处理逻辑抽象实现 AbstractValidateCodeProcessor两个子类分别实现发送功能 Ima…

Android实现登录系统(二)--SMS短信验证登录

SMS短信验证登录,大部分提供的这种服务都是要收费的, 但是Mob网站提供的并不收费,它是通过验证码的格式收费这样的服务盈利的, 也就是说使用他们的&#xf…

Android入门:利用SmsManager发送短信

我们可以通过Intent调用发送短信的服务,但是也可以通过SmsManager发送; 一、为何需要自己开发短信发送器 虽然在Android系统中已经存在发送短信的应用,但是如果我们在开发其他应用时需要集成发送短信功能,则很方便。 二、开发短信…