GPT-4o mini是什么?

今天,全网都知道 OpenAI 发现货了

GPT-4o mini 取代 GPT 3.5,从此坐上正主之位。

图片

从官网信息来看,OpenAI 最新推出的 GPT-4o mini 重新定义了 AI 成本效益的标准,其性能优于前代模型 GPT-3.5 Turbo,且成本大幅降低。这款模型不仅在多模态评估中取得了显著成绩,而且在未来的图像、视频和音频处理中展现出巨大潜力。

  1. 卓越的性价比:GPT-4o mini 在 MMLU 中以 82% 的得分领先市场,成本仅为每百万输入 Token 0.15 美元,输出 Token 0.6 美元。

  2. 强大的多模态能力:在 MMMU 中得分 59.4%,显示了其处理文本、图像、甚至未来视频和音频的能力。

  3. 128k 上下文窗口:优化了长篇文档的处理,为后续详细的功能测评提供了理想的技术基础。

新手如何使用GPT4o mini?

能力:Claude3.5>GPT4o>Claude3>GPT4.0 turbo > GPT3.5 turbo > GPT3.5

为了方便,我整理了放在下边,有需要的自取~

AiChat:智能办公助手

接下来的测评将深入探索这些特点,以及 GPT-4o mini 在实际应用中的表现如何。

图片

但遗憾的是现在对话窗口不支持图片/文件上传,对于普通用户来讲暂时无法测试和体验多模态能力。仅支持文本(且大幅改善了非英文的效率)和视觉的是 GPT-4o mini 的 API,未来还将支持文本、图像、视频和音频输入和输出。

图片

数学推理

先来看看最近火爆的“比大小”题目,这可难倒不少大模型。对于 GPT-4o mini,我直接连续用中英文提问 3 个问题,很遗憾这三问它都答错了,原本想着着新发的模型应该不错吧,谁知也不太聪明!GPT-4o mini 的“数学推理”能力同样有待加强。

然而,优于GPT-4o的,OpenAI提到,此次发布的新模型GPT-4o mini“Faster for everyday tasks”。

它的响应速度明显快于GPT-4o,几乎无需等待。从正式开放到当前全球用户的使用反馈来看,GPT-4o mini的“快”毋庸置疑,但实际使用体验上(包括指令执行完成度等)还差些火候。

根据OpenAI官方展示的数据,GPT-4o mini的性能表现出很强的竞争力,其在文本智能和推理基准、数学推理、多模态推理评估方面均优于其竞品Gemini Flash和Claude Haiku。

来源:OpenAI官网

来源:OpenAI官网

“小模型”或将流行,接下来还有谁?

在7月19日凌晨,紧随OpenAI,Mistral Al发布了12B的小模型,该产品是同英伟达合作开发,上下文长度为128K,与OpenAI正面对战。

按照计划,Meta也将于7月23日发布400B参数的Llama 3模型,并承诺将带来新的功能,如多模态能力、多语种对话、更长的上下文窗口以及更强的整体性能。

在国内,阿里云Qwen于7月16日推出了类似于GPT-4o的更适于小端应用的语音助手。而商汤早前已经推出首个实时交互模型“日日新5o”,科大讯飞的星火大模型交互性能也已对标GPT-4o。

可见,大模型公司的较量没有终点。同时,小端侧模型或将成为下一个大模型热门赛道。

OpenAI此次采用了抢先发布的营销策略,在推出小模型GPT-4o mini的同时,也进一步唤起了人们对GPT-5的期待。

据 OpenAI CEO Sam Altman透露,GPT-4o的语音模式将在本月晚些时候推出。

小端交互模型来了,AI生活化还会远吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/382266.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

查看公网IP的网络出口

文章目录 背景 背景 有时候在各种交易或其他时候,会被问到给我一个公网IP,我来帮你加白名单。 这个怎么怎么获取公网IP呢,在自己本机查看ipconfig或者ifconfig ip a 等命令查到的一般都是局域网的IP,每台机器都需要一个IP来进行对…

数学建模学习(111):改进遗传算法(引入模拟退火、轮盘赌和网格搜索)求解JSP问题

文章目录 一、车间调度问题1.1目前处理方法1.2简单案例 二、基于改进遗传算法求解车间调度2.1车间调度背景介绍2.2遗传算法介绍2.2.1基本流程2.2.2遗传算法的基本操作和公式2.2.3遗传算法的优势2.2.4遗传算法的不足 2.3讲解本文思路及代码2.4算法执行结果: 三、本文…

基于MobileNetv2的垃圾分类函数式自动微分-昇思25天打卡

基于MobileNetv2的垃圾分类 本文档主要介绍垃圾分类代码开发的方法。通过读取本地图像数据作为输入,对图像中的垃圾物体进行检测,并且将检测结果图片保存到文件中。 1、实验目的 了解熟悉垃圾分类应用代码的编写(Python语言)&a…

linux 网络子系统

__netif_receive_skb_core 是 Linux 内核网络子系统中一个非常重要的函数,它负责将网络设备驱动层接收到的数据包传递到上层协议栈进行处理。以下是对该函数的一些关键点的详细解析: 一、函数作用 __netif_receive_skb_core 函数是处理接收到的网络数据…

linux 解决端口占用

1.查询被占用的端口 netstat -tln | grep 60602.查询该端口对应的服务 lsof -i :60603.杀死该进程 //14868是第二步的PID kill -9 14868

ubuntu在命令行输出里查找内容,dmesg

直接执行查看日志指令会出来很多页。dmesg为开机日志信息。记录了开机时硬件的过程 sudo dmesg 执行结果: 可以用竖号“|”,在前一条命令返回的内容进行查找。下图为查找bluetooth sudo dmesg |grep -i bluetooth

算法-嵌套类递归解题套路

文章目录 理论基础 :1. 基本计算器2. 字符串解码3. 求原子数量 理论基础 : 嵌套类递归是指一种一个字符串形式的问题通过嵌套调用子函数从而求解出结果的一类问题, 解题方法相对来说比较的固定, 我们总结为下面的几部分 大概过程 : 定义全局变量where递归函数 f ( i ) : s [ i …

【C++】——初识模版

文章目录 前言函数模版函数模版的原理函数模版的实例化 类模版类模版的实例化 前言 当我们使用一个通用的函数: //为每一个类型都编写一个重载版本 void Swap(int& left, int& right) {int temp left;left right;right temp; } void Swap(double& …

C# 与C++ cli

cli CLI(Command Line Interface)是一种通过命令行界面与计算机系统进行交互的方式。它提供了一种以文本形式输入命令和接收系统输出的方法,用于执行各种操作和管理计算机系统。以下是CLI的详细解释: 一、定义与基本概念 定义&…

编程中的智慧四:设计模式总览

前面三篇我们通过从一些零散的例子,和简单应用来模糊的感受了下设计模式在编程中的智慧,从现在开始正式进入设计模式介绍,本篇将从设计模式的7大原则、设计模式的三大类型、与23种设计模式的进行总结,和描述具体意义。 设计模式体…

【中项】系统集成项目管理工程师-第4章 信息系统架构-4.5技术架构

前言:系统集成项目管理工程师专业,现分享一些教材知识点。觉得文章还不错的喜欢点赞收藏的同时帮忙点点关注。 软考同样是国家人社部和工信部组织的国家级考试,全称为“全国计算机与软件专业技术资格(水平)考试”&…

关卡1-2:Python关卡

关卡1-2:Python关卡 一、python实现wordcount二、通过本地VSCODE连接internStudio与debug2.1使用本地的VSCODE连接InternStudio2.2 debug插件安装2.3 debug进行时2.3.1 代码准备2.3.2 选择python解释器2.3.3 打断点 一、python实现wordcount 采用python实现经典任务…

虚拟机迁移报错:虚拟机版本与主机“x.x.x.x”的版本不兼容

1.虚拟机在VCenter上从一个ESXi迁移到另一个ESXi上时报错:虚拟机版本与主机“x.x.x.x”的版本不兼容。 2.例如从10.0.128.13的ESXi上迁移到10.0.128.11的ESXi上。点击10.0.128.10上的任意一台虚拟机,查看虚拟机版本。 3.确认要迁移的虚拟机磁盘所在位…

大厂面试-基本功

大厂面试第4季 服务可用性多少个9是什么意思遍历集合add或remove操作bughashcode冲突案例BigdecimalList去重复IDEA Debugger测试框架ThreaLocal父子线程数据同步 InheritableThreadLocal完美解决线程数据同步方案 TransmittableThreadLocal 服务可用性多少个9是什么意思 遍历集…

Android中systrace配置及注意问题

Android中systrace配置及注意问题 systrace配置的官方文档地址如下:优化启动时间 Systrace systrace 允许在启动期间收集内核和 Android 跟踪记录。systrace 的可视化可以帮助分析启动过程中的具体问题。(不过,如果要查看整个启动过程中的平…

[Spring] Spring配置文件

🌸个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 🏵️热门专栏: 🧊 Java基本语法(97平均质量分)https://blog.csdn.net/2301_80050796/category_12615970.html?spm1001.2014.3001.5482 🍕 Collection与…

DocRED数据集

DocRED数据集文件夹包含多个JSON文件,每个文件都有不同的用途。以下是这些文件的用途解释以及哪个文件是训练集: 文件解释 dev.json:包含开发集(验证集)的数据,通常用于模型调优和选择超参数。 label_map…

Java | Leetcode Java题解之第260题只出现一次的数字III

题目: 题解: class Solution {public int[] singleNumber(int[] nums) {int xorsum 0;for (int num : nums) {xorsum ^ num;}// 防止溢出int lsb (xorsum Integer.MIN_VALUE ? xorsum : xorsum & (-xorsum));int type1 0, type2 0;for (int n…

Java 中的异常

异常:就是出现的问题。 在Java中异常被当成对象进行处理,所有的异常类都继承于Throwable类,如果Java提供的异常类并不能满足需求,用户还可以自己定义一个异常类。 下面是异常体系结构: Throwable又分成了Error和Exce…

PHP框架详解- symfony框架

文心一言 Symfony框架是一个用PHP语言编写的开放源代码的Web应用框架,旨在加速Web应用程序的开发过程,提高代码的可维护性和可扩展性。以下是对Symfony框架的详细解析: 一、框架概述 起源与开发者: Symfony由SensioLabs&#…