OpenAI最强多模态语言模型来了:GPT-4发布


❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

GPT-4

(封面图由ERNIE-ViLG AI 作画大模型生成)

OpenAI最强多模态语言模型来了:GPT-4发布

OpenAI最新推出了深度学习中规模最大的多模态模型——GPT-4,它接受图像和文本输入,并生成文本输出。GPT-4虽然在许多实际场景中的能力不及人类,但在各种专业和学术基准测试中表现出了人类级别的性能。例如,它通过了模拟的律师资格考试,并获得了约排名前10%的分数,而GPT-3.5的分数约为排名倒数10%。经过6个月的迭代调整和ChatGPT的帮助,GPT-4在事实性、可操纵性和不越界方面取得了迄今为止最好的结果(尽管远非完美)。
GPT-4

1. GPT-4训练过程

GPT-4的训练过程是OpenAI与Azure合作,设计了一个超级计算机,并在过去两年中重建了整个深度学习栈。一年前,他们以GPT-3.5为“试跑”模型进行了训练,并修复了一些错误和提高了理论基础。因此,GPT-4的训练结果对于OpenAI来说是前所未有的稳定,是他们首个能够准确预测训练性能的大型模型。随着继续专注于可靠的扩展,他们的目标是磨练方法,以帮助他们更加提前预测和准备未来的能力——这对于安全至关重要。

GPT-4可以接受文本和图像输入,并生成文本输出。它比GPT-3.5更可靠、更具创造性,能够处理更多细微的指令。OpenAI测试了多种基准测试,包括模拟人类设计的考试。他们使用最新的公共测试(在奥林匹克和AP自由回答问题的情况下)或购买2022-2023年的练习考试进行测试。在这些考试中,他们没有进行特定的培训。虽然模型在训练过程中看到了少数考试问题,但OpenAI相信结果是有代表性的。他们还将GPT-4评估在传统的机器学习模型基准测试上。GPT-4相对于现有的大型语言模型以及包括基准特定工艺或额外训练协议的大多数最先进的模型(SOTA)表现出色。

GPT-4还可以接受并处理各种语言输入,包括低资源语言,如拉脱维亚语、威尔士语和斯瓦希里语等。
GPT-4 3-shot accuracy on MMLU across languages

2. 评估结果

对于语言模型而言,评估指标包括了模型的生成能力、模型对于文本逻辑结构的把握能力、模型对于事实准确性的处理能力、模型的多样性等。根据OpenAI官方发布的信息,GPT-4在这些指标上都有着不俗的表现。例如,GPT-4在某些职业和学术测试上表现出了人类水平的能力,例如在模拟律师考试时,GPT-4的得分达到了全体测试者的前10%,而之前的GPT-3.5的得分仅在后10%。

此外,GPT-4还在多语言的测试中表现出了优异的能力,对于包括低资源语言在内的26种语言的测试中,GPT-4在24种语言中都超过了GPT-3.5等其它语言模型的表现。另外,GPT-4对于图像输入的处理能力也在不断优化中,目前已经能够接受文本和图像的混合输入,并生成自然语言、代码等文本输出。在图像输入测试中,虽然还处于研究阶段,但是OpenAI官方也已经公布了一些初步的测试结果,表明GPT-4在这一领域也有着不俗的表现。

3. 使用案例——地表最强

(1)理解图片中的笑点

使用案例

(2)理解图表中的数据

使用案例

(3)直接看图片做题

使用案例

(4)理解图片中的不正常现象

使用案例

(5)阅读论文并总结

使用案例

(6)懂梗???(以后可以说脱口秀了)

使用案例

(7)理解图片中的笑话

使用案例

4. 局限性

虽然GPT-4在多个指标上都表现出了优异的能力,但是其仍然存在一些局限性。

  • 首先,GPT-4目前仍然无法完全理解和应用人类语言中的一些文化背景和情感色彩等非语义信息。虽然在一些测试中,GPT-4表现出了令人惊讶的创造力和多样性,但是在一些情境下,其生成的文本仍然存在一些逻辑不清或与上下文不符的问题。

  • 其次,GPT-4在处理一些非常具体的任务时,可能需要通过特定的预训练或针对性的微调才能够达到人类水平的表现。虽然GPT-4可以处理许多通用性任务,但是对于某些领域的专业知识,其表现仍然可能有所欠缺。

  • 最后,GPT-4在训练过程中消耗了大量的计算资源,其计算量甚至高于之前的GPT-3.5。这也使得GPT-4的训练和应用成本都较高,且在当前技术和硬件水平下,GPT-4的规模和效率仍然存在一定的瓶颈。

5. 风险

在风险和缓解措施方面,GPT-4的风险包括产生有害建议、错误代码或不准确信息等问题,但其新增的能力也导致了新的风险表面。OpenAI通过与50多个领域专家合作,测试模型行为,收集反馈和数据,以改善模型的安全性。在减少对不允许的内容的响应和增加对敏感内容的响应等方面,OpenAI已经通过模型级干预来增加了GPT-4的安全性。

  • 在训练过程方面,GPT-4的基本模型像以前的GPT模型一样,使用公开数据和已许可的数据进行预测下一个单词。通过强化学习和人类反馈,OpenAI调整了GPT-4的行为,使其在特定的范围内回答问题。

  • 在可预测性的扩展方面,OpenAI建立了一个可以进行可预测的深度学习堆栈,以满足GPT-4这样的大规模训练的需求。通过开发基础架构和优化,OpenAI可以跨多个规模具有非常可预测的行为。

同时,OpenAI还发布了一个名为OpenAI Evals的软件框架,用于创建和运行评估模型的基准测试。这个框架可以帮助评估不同的人工智能语言模型的性能,以期进一步提高这些模型的质量。

参考文献

[1] GPT-4 https://openai.com/research/gpt-4
[2] GPT-4 Technical Report https://cdn.openai.com/papers/gpt-4.pdf


❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23033.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

六足仿生机器人的控制与实现

目 录 摘 要 I Abstract II 1 文献综述 1 1.1 国外六足仿生机器人的发展情况 1 1.2 国内六足仿生机器人的发展情况 2 1.3 六足仿生机器人研究中存在的问题 2 1.4 六足仿生机器人的发展趋势 3 1.5 论文的主要内容 3 1.6 小结 4 2 六足仿生机器人的结构分析与步态规划 5 2.1 昆虫…

仿生蛇机器人

仿生类机器人 开头蛇形机器人研究意义结构分析生物结构分析 运动学分析 总结 开头 好久没写这个了,事情太多了,把这学期学的一些分享放上面。随便看看吧。仿生机器人是机器人的一个分支。相比于刚性齿轮结构和传动结构,一些动物的柔性结构使…

仿生水下航行器

仿生水下航行器 前面介绍的水下航行器的设计,大部分都是螺旋桨推进,虽然目前仍然广泛用于各种成熟的产品或者研发作品中,但是不得不承认的是螺旋桨在水下的推进的效率较低,对水下环境的扰动较大,不利于隐蔽&#xff0c…

仿生机器人

“仿生机器人”是指模仿生物、从事生物特点工作的机器人。当今世界,科技发展水平日益进步,机器人研究领域已经向航空航天、水面水下、地下管道等环境发展,未来的机器人将在人类无法工作的环境中代替人类工作,人们要求机器人不仅适…

仿生机器鱼设计

锐晶-Recrystal-重塑仿生机器人 欢迎进入Recrystal世界 分享在仿生机器鱼研制过程的一些心得与体会,最想与志同道合的朋友一起完成我们的梦想! 新的起点 机器鱼3D图,整个机器鱼外部结构件采用3D打印。 机器鱼3D图 舵机工作原理 机器鱼内…

仿生机器人研究

仿生机器人是指依据仿生学原理,模仿生物结构、运动特性等设计的机电系统,已逐渐在反恐防爆、太空探索、抢险救灾等不适合由人来承担任务的环境中凸显出良好的应用前景。 研制仿生机器人的灵感来源于自然界中的动物,比如蜥蜴是有着优秀运动能力…

计算机是仿生学,一种基于人体仿生学的计算机键盘的制作方法

本实用新型属于计算机键盘技术领域,具体涉及一种基于人体仿生学的计算机键盘。 背景技术: 键盘是最常用也是最主要的输入设备,通过键盘,可以将英文字母、数字和标点符号等输入到计算机中,从而向计算机发出命令和输入数…

蝴蝶优化算法

蝴蝶优化算法 算法简介香味具体算法 参考文献 群智能算法学习笔记 笔记内容和仿真代码可能会不断改动 如有不当之处,欢迎指正 算法简介 蝴蝶优化算法(butterfly optimization algorithm, BOA)是Arora 等人于2019年提出的一种元启发式智能算法。该算法受到了蝴蝶觅食…

仿生机器人知识体系

仿生机器人最核心的是模仿行为。 机器人控制算法 PID控制(比例积分微分控制) 根据给定值和实际输出值构成控制偏差,将偏差按比例、积分和微分通过线性组合构成控制量,对被控制对象进行控制。 ZMP零力矩点 判定仿人机器人动态…

字节跳动将双月OKR调整为季度;马斯克批OpenAI违背初心:被微软控制,只顾赚钱;苹果上新348元省电保护膜|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

BFT 最前线 | OpenAI开放网络浏览和插件;“360AI商店”上线;Bing市场份额不升反降;亚马逊机器人配送中心投产

原创 | BFT机器人 AI视界 TECHNOLOGY NEWS 01 OpenAI将向所有ChatGPT Plus用户推出网络浏览和插件 OpenAI将向所有ChatGPT Plus用户推出网络浏览和插件近日,OpenAI发文称,将在本周(5.15-5.21日)内向所有ChatGPT Plus用户推出网络…

LLMs开源模型们和数据集简介

本篇文章整理下目前常用的LLMs模型们和数据集简介。 BackBones ​https://github.com/FreedomIntelligence/LLMZoo 可以看到目前被广泛用来作为LLMs的backbone的模型有以下特点: Backbone:基于某个开源backbone,如GLM、LLaMA、BLOOMZ&#…

谷歌将推出新工具以识别虚假信息和AI生成内容;ChatGPT开放投资组合分析功能;网信办打击滥用AI虚拟主播等行为丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 后摩智能发布存算一体智驾芯片鸿途H30 5月15日,后摩智能发布首款存算一体智驾芯片 —— 鸿途H30,最高物理算力256TOPS,典型功耗35W。鸿途H30基于SRAM存储介质,采用…

分享一个程序员接私活、兼职的平台

分享一个程序员接私活、兼职的平台 1、技术方向满足任一即可2、技术要求3、最后 1、技术方向满足任一即可 Python:熟练掌握Python编程语言,能够使用Python进行数据处理、机器学习和深度学习等相关工作。 MATLAB:熟练掌握MATLAB编程语言&…

最担心的还是发生了,程序员失业来得太突然!

周末我在后台收到一条私信,事情很有代表性,这里分享一下。 这位老哥在一家互联网头部公司做了 6 年的技术,最好的年纪都留在了这家公司。上个月底,赶上所在的部门重组。 公司动作很快,开完年中回顾会就裁掉了一批人&am…

猿如意初体验!赞一个。

目录 功能一:chatGPT 功能二、对 “效率工具”的试体验! 功能三:教程文档 最后总结 猿如意传送门猿如意下载地址:猿如意-程序员的如意兵器,工具代码,一搜就有 猿如意使用了几次了,今天来想分享一下我对于猿如意的…

如意如意猿如意

如意如意猿如意 什么是猿如意猿如意效率工具JSON编辑器jsontojava 开发工具ChatGPT 推荐指数评分及改进意见UI界面效率工具和开发工具ChatGPT一行代码 总结 经常听到一句话:如意如意随我心意,作为程序猿,我也想要一个如意,心中默念…

CSDN官方猿如意工具体验

2022年注定是不平凡的一年,2022再见,2023你好! 2023愿我们发财,被爱,一路好运常在!愿所念之人平安喜乐,所想之事顺心如意,岁岁常欢喜,万事皆胜意! 猿如意工具…

【附源码】国内首届Discord场景创意编程开源项目

以下开源项目是由环信联合华为举办的《国内首届Discord场景创意编程赛》作品,附源码,一键即用。 一、 模拟器游戏直播-新新人类 新新人类模拟器游戏直播基于环信超级社区Demo构建,增加以“video-x”命名的新型Channel,用户可在本…

学霸福音!用ChatGPT做思维导图,整理读书笔记从未如此轻松

背景说明: 罗永浩《我的奋斗》这本书,我在参加一场线上读书会分享过,原文在这里。当时演示的时候,使用的是思维导图的模式。我在想,如果给ChatGPT设定一个读书会讲书人的身份,它会怎么讲?下面我…