价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

OpenAI 今日推出了一款名为 GPT-4o Mini 的新模型,这款模型较轻便且成本更低,旨在为开发者提供一个经济实惠的选择。与完整版模型相比,GPT-4o mini 在成本效益方面表现卓越,价格仅为每百万输入 tokens 15 美分和每百万输出 tokens 60 美分,比之前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜超过 60%。这种经济实惠的定价使得更多的应用程序能够负担得起 AI 技术,预计将大大扩展 AI 应用的范围。

使用 OpenAI 的模型构建应用程序可能会产生巨额费用,许多开发者因此望而却步,转而选择谷歌的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku 等更便宜的模型。为此,OpenAI 进入了轻量级模型市场。OpenAI 的 API 平台产品负责人 Olivier Godement 在接受媒体采访时表示:“我认为 GPT-4o Mini 真正体现了 OpenAI 使 AI 更广泛可及的使命。如果我们希望 AI 能惠及世界的每一个角落、每一个行业、每一个应用,我们就必须让 AI 更加实惠。”

从今天开始,ChatGPT 免费版、Plus 版和团队计划的用户可以使用 GPT-4o Mini 代替 GPT-3.5 Turbo,企业用户将在下周获得访问权限。这意味着 ChatGPT 用户将不再能使用 GPT-3.5,但开发者仍可以通过 API 使用它,如果他们不想切换到 GPT-4o Mini。Godement 表示,GPT-3.5 将在某个时间点从 API 中退役,具体时间尚未确定。

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

具有卓越文本智能和多模态推理的小型模型

新模型不仅支持文本,还支持 API 中的视觉功能,未来还将处理视频和音频等多模态输入和输出。凭借这些能力,GPT-4o Mini 可以用于理解旅行行程并提供建议等更复杂的虚拟助手功能。然而,该模型主要用于简单任务,因此没有人会真正用它来廉价地构建类似 Siri 的助手。

GPT-4o mini 在学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,无论在文本智能还是多模态推理方面都表现出色,并支持与 GPT-4o 相同的语言范围。它在函数调用方面表现优异,能让开发者构建从外部系统获取数据或采取行动的应用程序,并且相比 GPT-3.5 Turbo,长上下文性能有所提升。

在测量大规模多任务语言理解(MMLU)测试中,GPT-4o Mini 取得了 82% 的得分。这项基准考试包括 57 个学科的约 16000 道选择题。相比之下,GPT-3.5 的得分为 70%,GPT-4o 为 88.7%,而谷歌声称其 Gemini Ultra 创下了 90% 的最高得分。竞争模型 Claude 3 Haiku 和 Gemini 1.5 Flash 分别得分 75.2% 和 78.9%。然而,研究人员对这些基准测试持谨慎态度,因为各家公司进行测试的方式略有不同,分数难以直接比较。此外,AI 可能会在其数据集中包含这些答案,从而让它“作弊”。

对于渴望以低成本构建 AI 应用的开发者来说,GPT-4o Mini 的推出为他们提供了另一种工具。OpenAI 让金融科技初创公司 Ramp 测试了该模型,使用它构建了一个提取收据费用数据的工具,用户可以上传收据的照片,模型会自动整理信息。电子邮件客户端 Superhuman 也测试了 GPT-4o Mini,并用它创建了电子邮件回复的自动建议功能。

这款新模型的目标是为开发者提供一种轻量级且廉价的工具,帮助他们创建无法负担更大、更昂贵模型的应用和工具。许多开发者会选择 Claude 3 Haiku 或 Gemini 1.5 Flash,而不是支付运行最强大模型之一所需的高昂计算成本。

至于为什么 OpenAI 花了这么久的时间才推出这个模型,Godement 表示,这是“纯粹的优先级问题”,因为公司专注于创建更大更好的模型,如 GPT-4,这需要大量的人力和计算资源。随着时间的推移,OpenAI 发现开发者渴望使用更小的模型,因此公司决定现在是投资资源构建 GPT-4o Mini 的时机。

内置安全措施

GPT-4o mini 继承了 GPT-4o 的安全措施,确保在开发过程中的每一步都强化安全性。从预训练阶段开始,OpenAI 就过滤掉仇恨言论、成人内容和垃圾信息等不希望模型学习或输出的内容。在后训练阶段,通过人类反馈强化学习(RLHF)等技术,使模型的行为与政策保持一致,提高模型响应的准确性和可靠性。

GPT-4o mini 具有与 GPT-4o 相同的安全缓解措施,这些措施通过自动和人工评估进行了仔细评估。来自社会心理学和虚假信息等领域的 70 多位外部专家测试了 GPT-4o,以识别潜在风险,OpenAI 已经解决了这些问题,并计划在即将发布的 GPT-4o 系统卡和准备得分卡中分享详细信息。这些专家评估的见解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。

此外,GPT-4o mini 还首次在 API 中应用了指令层级方法,增强了模型抵御越狱、提示注入和系统提示提取的能力,确保模型响应的可靠性和安全性。

可用性和未来展望

GPT-4o mini 现已在 Assistants API、Chat Completions API 和 Batch API 中上线。开发者可以通过支付每百万输入 tokens 15 美分和每百万输出 tokens 60 美分的费用,使用这一新型模型。在 ChatGPT 平台上,Free、Plus 和 Team 用户今天起可以使用 GPT-4o mini,取代 GPT-3.5,企业用户也将在下周开始访问。

OpenAI 承诺在未来继续推动 AI 技术的普及和成本降低。自 2022 年推出能力较低的 text-davinci-003 模型以来,GPT-4o mini 的每个 token 成本已下降了 99%。OpenAI 设想未来模型将无缝集成到每个应用程序和网站中,推动 AI 应用更高效、更经济地发展。​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/379962.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【接口自动化_12课_基于Flask搭建MockServer】

DAY12_基于Flask搭建MockServer 目标:通过本节课主要核心内容要理解什么是MockServer,并且结合Flask进行实战。 章节大纲 1. 什么是Mock及应用场景理解 2. 框架对比及Flask基本应用理解 3. Mock Server接口设计实战重要 4. Mock Server如何运行理解…

守护动物乐园:视频AI智能监管方案助力动物园安全与秩序管理

一、背景分析 近日,某大熊猫参观基地通报了4位游客在参观时,向大熊猫室外活动场内吐口水的不文明行为。这几位游客的行为违反了入园参观规定并可能对大熊猫造成严重危害,已经被该熊猫基地终身禁止再次进入参观。而在此前,另一熊猫…

IMU提升相机清晰度

近期,一项来自北京理工大学和北京师范大学的团队公布了一项创新性的研究成果,他们将惯性测量单元(IMU)和图像处理算法相结合,显著提升了非均匀相机抖动下图像去模糊的准确性。 研究团队利用IMU捕捉相机的运动数据&…

苹果电脑crossover怎么下载 苹果电脑下载crossover对电脑有影响吗 MacBook下载crossover软件

CodeWeavers 发布了 CrossOver 24 版本更新,不仅兼容更多应用和游戏,得益于 Wine 9.0 带来的 7000 多项改进,CrossOver 还可以在 64 位系统上运行Windows应用的软件,使得用户可以在Mac系统中轻松安装使用仅支持Windows系统运营环境…

GPU租赁教程/云主机使用教程/在线GPU环境部署/免费GPU/免费算力||运用云服务器,跑自己的深度学习模型(保姆级教程)

一、环境准备 pycharm professional(需要pycharm专业版,社区版不行)潞晨云(潞晨科技)访问链接,目前应该是最便宜的GPU租赁平台了,不知道之后会不会涨价,点我链接注册送10元代金券,能跑6个小时的…

spark 动态资源分配dynamicAllocation

动态资源分配,主要是spark在运行中可以相对合理的分配资源。 初始申请的资源远超实际需要,减少executor初始申请的资源比实际需要少很多,增多executorSpark运行多个job,这些job所需资源有的多有的少,动态调整executor…

微信小程序 button样式设置为图片的方法

微信小程序 button样式设置为图片的方法 background-image background-size与background-repeat与border:none;是button必须的 <view style" position: relative;"><button class"customer-service-btn" style"background-image: url(./st…

Python 合并两个有序数组

Python 合并两个有序数组 正文 正文 题目说明如下&#xff1a; 这里我们直接让 nums1 的后 n 个数等于 nums2 数组&#xff0c;然后对 nums1 数组整体进行排序即可。 class Solution:def merge(self, nums1: List[int], m: int, nums2: List[int], n: int) -> None:"…

云原生系列 - Jenkins

Jenkins Jenkins&#xff0c;原名 Hudson&#xff0c;2011 年改为现在的名字。它是一个开源的实现持续集成的软件工具。 官方网站&#xff08;英文&#xff09;&#xff1a;https://www.jenkins.io/ 官方网站&#xff08;中文&#xff09;&#xff1a;https://www.jenkins.io…

网站开发:使用VScode安装yarn包和运行前端项目

一、首先打开PowerShell-管理员身份运行ISE 输入命令&#xff1a; set-ExecutionPolicy RemoteSigned 选择“全是”&#xff0c;表示允许在本地计算机上运行由本地用户创建的脚本&#xff0c;没有报错就行了 二、接着打开VScode集成终端 输入 npm install -g yarn 再次输入以…

[CP_AUTOSAR]_分层软件架构_接口之通信模块交互介绍

目录 1、协议数据单元(PDU)传输2、通信模块的案例2.1、SDU、 PCI & PDU2.2、通信模块构成2.3、从数据传输的角度看Communication2.4、Communication中的接口 在前面 《关于接口的一些说明》 以及  《Memory软件模块接口说明》 中&#xff0c;简要介绍了CP_AUTOSAR分层…

scp免密复制文件

实现在服务器A和服务器B之间使用scp命令免密互相传输文件 1. 在服务器A中免密复制到服务器B 1.1 生成服务器A的公钥私钥 #在服务器A中执行 ssh-keygen -t rsa -P ""命令执行完毕会在服务器A的 ~/.ssh 目录下生成两个文件&#xff1a;id_rsa 和 id_rsa.pub 1.2 拷…

nodejs下载+react安装

一、nodejs安装 1、nodejs下载 具体安装可参考连接&#xff1a;2023最新版Node.js下载安装及环境配置教程&#xff08;非常详细&#xff09;从零基础入门到精通&#xff0c;看完这一篇就够了_nodejs安装及环境配置-CSDN博客 下载地址&#xff1a;Node.js — 下载 Node.js 测…

web安全之SQL手工注入漏洞测试

一、目的 1.掌握SQL注入原理&#xff1b; Sql注入详解(原理篇)_sql注入攻击的原理-CSDN博客 2.了解手工注入的方法&#xff1b; 3.了解MySQL的数据结构&#xff1b; 4.了解字符串的MD5加解密 二、过程 1.进去后出现以下界面 找注入点 发现有注入点&#xff0c;即id被代入执…

AutoMQ 生态集成 Redpanda Console

通过 Kafka Web UI 更加便利地管理 Kafka/AutoMQ 集群 随着大数据技术的飞速发展&#xff0c;Kafka 作为一种高吞吐量、低延迟的分布式消息系统&#xff0c;已经成为企业实时数据处理的核心组件。然而&#xff0c;Kafka 集群的管理和监控却并非易事。传统的命令行工具和脚本虽…

【分布式事务】怎么解决分布式场景下数据一致性问题

分布式事务的由来 拿充值订单举个栗子吧&#xff0c;假设&#xff1a;原本订单模块和账户模块是放在一起的&#xff0c;现在需要做服务拆分&#xff0c;拆分成订单服务&#xff0c;账户余额服务。原本收到充值回调后&#xff0c;可以将修改订单状态和扣减余额放在一个mysql事务…

未来互联网的新篇章:深度解析Web3技术

随着技术的飞速发展&#xff0c;Web3作为新一代互联网技术范式&#xff0c;正在重新定义我们对互联网的认知和使用方式。本文将深入探讨Web3技术的核心概念、关键特征以及其在未来互联网发展中的潜力和影响&#xff0c;为读者打开Web3时代的大门。 Web3技术的核心概念和特征 1…

国内微短剧系统平台抖音微信付费小程序app开发源代码交付

微短剧作为当下热门的内容&#xff0c;结合抖音平台的广泛用户基础&#xff0c;开发微短剧付费小程序APP具有显著的市场潜力&#xff0c;用户对于短剧内容的需求旺盛&#xff0c;特别是在言情、总裁、赘婿等热门题材方面&#xff0c;接下来给大家普及一下微短剧小程序系统。 顺…

8、添加第三方包

目录 1、安装Django Debug Toolbar Django的一个优势就是有丰富的第三方包生态系统。这些由社区开发的包&#xff0c;可以用来快速扩展应用程序的功能集 1、安装Django Debug Toolbar Django Debug Toolbar位于名列前三的第三方包之一 这是一个用于调试Debug Web应用程序的有…

mybatis的xml中,where标签不自动删除多余的and之类的问题

遇到了这个莫名其妙的问题&#xff0c;起初是很疑惑的&#xff0c;where标签好像失灵了一般不会自动删除掉 多余的and 看了眼sql语句&#xff0c;发现还是有and没被删除。 后来重新写了遍后发现又没事了。真的是神人。 然后就研究了好一会&#xff0c;发现&#xff01;&#…