超越 ChatGPT,GPT-4 将成为下一个“顶流”?

出品人:Towhee 技术团队

从2022年底开始预热,智能对话机器人 ChatGPT (即 GPT 3.5)成功地又一次掀起了人工智能的热潮。除了AI 相关的从业者以外,如今 ChatGPT 已是家喻户晓。就在美国东部时间 3月14日,其所属公司 OpenAI 热打铁又推出了 GPT-4:**比 ChatGPT 更靠谱、更听话、更有创造力、更接近(甚至超过)人类。**根据来自各种项目(比如 ChatGPT)的反馈,OpenAI 在 GPT3.5 的基础上进行了不断的迭代。耗时六个月终于在 GPT-4 中实现了前所未有的结果,在真实性、可操纵性、拒绝超范围上都达到了历代最优秀的表现。除了在自然语言的理解能力上有了显著提升,GPT-4 还能够理解图像。目前只有少数获邀用户能够“尝鲜” GPT-4 的对话功能,而图像输入尚未对外开放。

在过去的两年中,OpenAI 重建了他们的整个深度学习堆栈,并携手 Azure 共同设计了一个超级计算机承载模型开发。如果说 GPT-3.5 是该系统的第一个“测试产品“, GPT-4 则是进一步修复错误和改进理论基础后诞生的“最新作品”。**OpenAI 认为这是他们目前最稳定、最优秀的大模型。**GPT-4 是一个大规模的多模态模型,能够接收图像和文本两种输入,在理解输入的数据后生成并返回文本回复。尽管 GPT-4 在现实生活中的能力受限,但它作为自然语言模型已经展现出了惊人的“智力”。官方报告声称他们仅用不超过千分之一的计算量训练了模型,就准确地预测 GPT-4 在各方面的性能。该报告表示 GPT-4 能够在各种专业的学术测试中展现出近乎人类的水平。它甚至通过了人类的律师考试模拟测试,成绩名列前 10%!(而ChatGPT 的成绩大约是倒数10%。)


GPT performance on academic and professional exams

GPT-4 的本质是一个使用大规模数据预训练的 GPT 模型。该模型基于 Transformer 结构,采用了最常见的 NLP 预训练任务之一,即预测文本中的下一个单词。而能够使 GPT 能力更上一层楼的重要步骤,是在训练之后使用 RLHF(人类反馈强化学习)方法进行额外的调整。观察 GPT 系列之前的表现,尤其面对不安全的输入时,RLHF 似乎不足以获得稳定良好的反馈。除此以外,当出现奖励模型收集数据时未曾使用的指令时,模型也可能会出现预期以外的不良行为。为此,GPT-4 加强了对模型自身的依赖,从而将模型引导到更细粒度的适当行为。这种针对安全的方法包括两个主要部分:在RLHF训练中额外引入一组与安全相关的提示、以及基于规则的奖励模型 (RBRM)。

RBRMs 其实是一组零样本迁移的 GPT-4 分类器,为 GPT-4 的策略模型提供额外的奖励信号。它们能够协助 RLHF 在微调时引导模型产生正确的行为,比如拒绝生成有害内容、接收无害请求等。RBRM 有三个输入:可选择性输入的提示、来自策略模型的输出、以及人为制定的评价标准。该奖励模型会根据制定的标准指引模型将回复分为四类:直接拒绝、隐晦拒绝(比如回避或顾左右而言他)、回复包含不允许的内容、安全的回应。然后根据安全相关的提示,当模型成功拒绝有害内容的请求时给予其奖励。同样,如果请求的内容根据提示确认为安全,奖励模型不拒绝此类安全请求。这种分类和奖励机制与其他改进相结合,能够更好地引导模型接近目标行为。

GPT-4 进行了模型级干预,增加了引发不良行为的难度,大幅减少了不良行为产生的可能性。然而,官方报告同时也指出这依然无法保证模型能够百分之百遵守规则。针对 GPT-4 和其后续模型有可能对社会产生的重大影响和其各种潜在的危险能力,OpenAI 正在与外部研究人员合作,以尽快寻找并推荐应对方案。

Combining GPT-4 & Stable Diffusion

除了官方资料外,最近有一篇由业内诸多顶尖“大佬”联名发布的论文 Sparks of Artificial General Intelligence: Early experiments with GPT-4 也引起了广泛的关注。该论文认为 GPT-4 使用了空前的计算资源和数据进行训练,是一种新型的大语言模型(LLM)。在他们的早期实验中,GPT-4 表现出了前所未有的通用智能。它能够在数学、编程、视觉、医学、法律、心理学等领域中解决或新颖或困难任务的能力,其水平接近甚至超过了人类水平。因此,GPT-4 可被视作通用人工智能的早期版本。不过论文也表明 GPT 系列存在一些实质性缺陷难以被克服,比如逻辑推理问题等,被认为是Transformer 模型使用预测下一个词的训练范式时所固有的问题。即使有研究指出一步步地指引能够改善 GPT 系列模型的行为,却无法从根本上解决问题。总的来说,作者们在测试 GPT-4 的各种能力时,也强调了探索 GPT-4 局限性的重要,讨论了社会舆论对科技发展的影响、以及人工智能面临的挑战和研究方向。

相关资料:

  • 项目地址:GPT-4
  • 相关论文:
    • GPT-4 Technical Report
    • Sparks of Artificial General Intelligence: Early experiments with GPT-4

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13765.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ernie3.5超越ChatGPT,中文测试胜过GPT-4

百度最近宣布,其旗下的ChatGPT风格服务在多个方面表现优于OpenAI的聊天机器人。该公司最新推出的AI模型Ernie3.5不仅在综合能力评分上超过了ChatGPT(GPT-3.5),而且在中文测试中也超越了GPT-4。这一成就标志着百度在人工智能领域取…

超越 ChatGPT ?AutoGPT 爆火,两周斩获 50k+ Star:无需人类插手,自主完成任务!...

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 刚上线两周就收获 50k Star,看来 Auto-GPT 是真的火了! (项目地址:https://github.com/Torantulino/Auto-GPT?refjina-ai-gmbh.ghost.io) …

超越 ChatGPT

今天在LLM上构建产品的技术。 现代指令调整语言模型(LLM)是软件工程师工具箱中的最新工具。加入数据库、网络、超文本和异步 Web 应用程序等经典技术,我们现在有一种新的使能技术,它看起来非常强大,但其最佳应用程序尚…

超越 ChatGPT:生成式人工智能如何塑造下一代智能系统

生成式 AI 系统的创建是过去几年人工智能领域最重要的进步之一。生成式 AI 系统可以产生新颖、独特和原始的输出,这与典型的 AI 系统形成鲜明对比,典型的 AI 系统是分类器,经过训练可以区分几种类型的项目。这种生成式 AI 为在各个行业中使用这些技术创造了有趣的新机会。 生…

爆火的 AutoGPT 超越 ChatGPT ?两周斩获 50k+ Star

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 刚上线两周就收获 50k Star,看来 Auto-GPT 是真的火了! (项目地址:https://github.com/Torantulino/Auto-GPT?refjina-ai-gmbh.ghost.io) …

只需一个Prompt,ChatGPT秒变万能导师,轻松学习任意领域知识

AI正在改变我们生活的方方面面,包括我们学习的方式。AI已经证明自己有能力成为我们的助手甚至是老师,帮助我们更有效地获取知识。 拿ChatGPT来说,我们平时有什么问题都可以向它提问,不过想让它更高效的帮助我们,还是需…

天花板级Prompt,用ChatGPT提升学习效率的10个指令,好到爆炸!

自我教育,比任何其他类型的教育都更重要——马克吐温 ChatGPT等生成式AI工具的出现,大大降低了自学的门槛,让人人皆可自我教育成为一种可能。 但,不同的人,用ChatGPT等AI工具自学的效果,可能天差地别。 今天,就给大家分享10个天花板级的ChatGPT学习指令。 用这些优…

ChatGPT、人工智能、人类和一些酒桌闲聊

© 2023 Conmajia Initiated 10th March, 2023 昨天跟某化学家喝酒,期间提到了 ChatGPT。他的评价是:这鬼东西大量输出毫无意义、错漏百出甚至是虚假的信息,“in a confident accent”。例如某次 GPT 针对“描述某某记者”这一问题&#…

印度这事真的干的挺棒的! |

来源:statista 最近逛外网看到一张图,是关于印度家庭自来水供应的对比图。Crore是印度的单位千万(卢比),所以他们从2019年供应3.23千万家庭,增长到了2022年的9.57万家庭,印度这事真的干的挺棒的! 一直以来印…

厦大纪老师chatgpt相关讲座3.7

在线更新数据,迭代学习训练,进而提高模型性能。 比较明显的是API部分,这一步学习的就是intruction,实现人机写作的复杂系统工程 数据充足,维基类似于百度百科 transformer结构更有优势,预测下一个字,模型越…

组织设计 | 后GPT时代下创新组织的演进方向和重构要素

过去几年,企业正在加速走向组织扁平化。后GPT时代,创新的组织设计正在成为促进技术和企业发展的原动力。在新型组织设计着眼于企业未来发展,除了组织层级的扁平化重构外,更需要在文化、激励机制、人才上的重构,赋予组织…

2023数智金融峰会:生成式AI将给金融行业带来什么?

2022年中央经济工作会议提出,要推动“科技—产业—金融”良性循环。依托科技力量等生产要素的创新,带动金融和产业相互促进,最终实现实体经济增长,是金融供给侧结构性改革的主要路径之一。 2月23日,新华财经与百度智能…

All in AI,现在开始算不算太晚?

编者按:目前大模型近乎可以帮助人类处理方方面面的事情,如对话、写文章、写代码等等。在大模型“狂飙”趋势下,想要从事AI领域的小伙伴可能会犹疑:现在进入AI领域会不会已经太晚了? 本文作者结合自身转型经历和对AI市场…

Stable Diffusion实现之 Huggingface

Stable Diffusion 以及Huggingface的安装实现 介绍: Stable Diffusion AI是指将Stable Diffusion模型应用于人工智能领域的相关技术和方法。通常情况下,Stable Diffusion AI主要用于金融、投资等领域,并且广泛应用于期权定价、风险管理等方…

49位专家预测:2023最火的科技趋势

译者 | Jane 来源 | 36氪(ID:wow36kr) 2023 年的科技趋势是什么?围绕生成式人工智能、Web3、创客经济等可能出现的情况,Fast Company 采访了初创公司创始人、科技大佬、风险投资人和学者们的看法,并收集了他…

有实力一定要进大厂

春招来了,很多还在找工作的同学可能会有疑虑,到底是进小公司好呢? 还是进互联网大厂好? 相比之下,大厂抗风险能力更强,内部员工的发展也更稳定。除此之外,相比小公司,大厂还会带来更…

数字化转型:当光子计算遇上金融领域

原标题为【光子计算在金融领域的研究应用——聚焦“光子金融科技”新方向】 作者 | 吴永飞 王彦博 沈亦晨 杨璇 光子计算作为前沿尖端技术之一,近年来蓬勃发展、逐步成熟,目前已基本具备与行业应用深度结合的可行性。本文立足金融领域业务实践&#xff0…

“大模型压缩神器”?十亿参数,一键瘦身!狂掉75%

作者:英特尔公司 陆崟彤 何欣 郭恒 程文华 王畅 王梦妮 沈海豪 编辑:新智元 本文介绍了可提升大语言模型的训练后量化表现的增强型 SmoothQuant 技术,说明了这项技术的用法,并证明了其在准确率方面的优势。此方法已整合至英特尔…

文心一言满月就「上班」:企业服务生产力拉满,演示现场人挤人

鱼羊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 给AI一个月时间,能进化成什么样? 文心一言“满月”之际,百度召开技术交流会,拿出这样的成绩单: 完成4次迭代,大模型推理成本降为原来十分之一。 当然这还不够…

港联证券投资前瞻:核电订单重回历史高位 C919圆满完成商业首航

上周五,沪指盘中弱势震荡下探,午后反弹拉升,科创50指数表现强势。截至收盘,沪指涨0.35%报3212.50点,深成指涨0.12%报10909.65点,创业板指跌0.66%报2229.27点,科创50指数涨1.66%;两市…