OpenAI发布GPT-4.5:功能非常特殊,推理很贵

今天凌晨4点,OpenAI进行了在线技术直播,发布了最新模型GPT-4.5。

GPT-4.5与之前的模型相比,本次最大的亮点是加上了“情商”,这也是目前所有大模型最缺、最难的功能。

此外,GPT-4.5 在SimpleQA上的测试数据显示,超过OpenAI o1、OpenAI o3-mini并且幻觉非常低,是目前OpenAI最强大模型之一。

图片

OpenAI联合创始人兼首席执行官Sam Altman特意发文对GPT-4.5进行了详细解读。

对我来说,GPT-4.5是第一个让我感觉像是在和一个有思想的人对话的模型。有好几次,我都不禁靠在椅背上,惊讶于能从人工智能那里得到真正有用的建议。

坏消息:GPT-4.5是一个大型且成本高昂的模型。我们本真的很想同时向Plus和Pro用户推出,但我们的业务增长迅猛,GPU 已经不够用了。下周我们会增加数万个 GPU,到时候就会向 Plus 用户推出。(很快还会有数十万个 GPU 到位,我敢肯定,大家会把我们能配备的每一个 GPU 都充分利用起来。)

我们也不想这样,但要精准预测导致 GPU短缺的增长高峰实在太难了。

提前告知一下:这不是一个推理模型,也不会在基准测试中表现得特别突出。是一种不同类型的智能,有着我从未感受过的神奇之处。真的很期待大家去体验!

图片

看了Sam这段话估计大家心里都有一个共同想法吧,既然推理这么贵,需要那么多GPU,是时候让DeepSeek再次出手量化一下了吧~

这不网友直接就替咱说出来了,你们一直严重依赖大量的 GPU,而中国人在没有这么多 GPU 的情况下也取得了同样的成果。为什么不像中国人那样专注于效率呢?

作为一名交易员,我只是不希望当 Deepseek用十分之一的计算力推出比 GPT-4.5 更强大的产品时,交易市场再次陷入动荡。

图片

刚刚看了一下API价格,确实贵的离谱…

图片

这听起来像是一个在大量录制的人类之间电话通话内容上进行训练的模型。

图片

增加服务之后,API价格会下降吗?

图片

真是令人激动的时代!一个真正让人感觉像是在与有思想的人对话的模型,这是一个巨大的飞跃。GPU 短缺只是暂时的困难,重要的是你们创造出的神奇成果。期待能亲自体验 GPT-4.5!

图片

GPT-4.5情商

在以往的大模型中,虽然能够生成流畅的文本,但在处理情感相关的场景时,往往显得生硬、机械,甚至有时会给出不恰当的回应。

GPT-4.5通过一系列技术创新和训练方法为模型增加了“情商”功能,显著提升了其在情感识别、同理心表达以及情感引导等方面的能力,使其在与人类互动时能够展现出更加温暖、细腻且富有同理心的特质。

GPT-4.5能够通过用户的文字输入,敏锐地捕捉到其中的情感色彩,无论是喜悦、悲伤、愤怒还是焦虑。这种能力并非简单地基于关键词的匹配,而是通过深度学习和大量的对话数据训练而来。

模型学会了从语句的整体语境中理解情感的细微差别,从而能够更准确地判断用户的情绪状态。例如,当用户表达“我最近考试没过,心情很糟糕”时,GPT-4.5不仅能够识别出这句话中的负面情绪,还能进一步感知到用户可能需要的不仅仅是解决问题的建议,更需要的是情感上的支持和安慰。

基于这种情感识别能力,GPT-4.5能够以一种富有同理心的方式回应用户。不会简单地给出一些通用的、冷漠的建议,而是会用温暖、关怀的语言来表达对用户情感的理解和支持。例如,可能会说:“哎呀,听到这个我很难过。考试没过确实会让人感到沮丧和失落,但这只是暂时的,并不能代表你的能力和价值。”

图片

这样的回应不仅能够缓解用户的情绪,还能让用户感受到被理解和关注。这种同理心的表达是GPT-4.5情商功能的核心体现,使得模型在与人类互动时更加自然、亲切,仿佛是一个真正能够倾听和理解的朋友。

此外,GPT-4.5还具备情感引导的能力。不仅能够回应用户当前的情感状态,还能够通过对话引导用户走向更加积极的情绪状态。

例如,在面对用户的焦虑或压力时,GPT-4.5可以提供一些缓解压力的方法,或者通过鼓励的话语帮助用户重建信心。可能会说:“虽然这次考试没有达到预期,但你可以把当作一个学习的机会,相信自己下次一定能够做得更好。”这种情感引导能力使得GPT-4.5不仅仅是一个被动的情感回应者,更是一个能够帮助用户调节情绪的真正人工智能。

GPT-4.5架构简单介绍

GPT-4.5的核心架构建立在无监督学习和推理能力的结合之上。无监督学习是其基础,通过海量未标注数据的训练,模型能够自主学习语言的结构和模式,从而提高其准确性和直觉能力。使得模型在处理复杂的语言任务时,能够凭借其对语言的深刻理解来生成更加自然和准确的文本。

推理能力的引入为模型增加了“思考”推理链的能力,在回答问题之前进行逻辑分析和思考,这在处理需要复杂推理的任务时尤为重要,例如,科学问题、数学问题以及其他需要深度分析的复杂问题。

在预训练完成后,GPT-4.5还使用了复杂的后训练过程。采用了监督微调和基于人类反馈的强化学习相结合的方法。监督微调通过标注数据进一步优化模型的性能,使其在特定任务上表现得更加精准。

图片

这种方法使得模型能够更好地适应不同的应用场景,提高其在实际任务中的表现。而基于人类反馈的强化学习则让模型能够更好地理解人类的需求和意图。通过与人类的互动,模型不断学习如何生成更符合人类期望的文本,从而使对话更加自然和富有情感。

在模型规模方面,GPT-4.5是OpenAI迄今为止最大的模型,其参数规模达到了前所未有的高度。为了训练这样一个庞大的模型,OpenAI开发了一系列创新的训练机制。

其中,低精度训练技术是关键之一,通过优化计算资源,低精度训练使得模型能够在有限的硬件条件下进行高效的训练。这种技术不仅提高了训练效率,还降低了训练成本,使得大规模模型的训练成为可能。

图片

OpenAI还首次尝试了跨数据中心的分布式训练。由于模型规模庞大,单个数据中心的计算资源无法满足其训练需求。因此,OpenAI利用多个数据中心同时进行预训练,充分利用了大规模计算资源,显著提升了模型的训练效率。

目前,ChatGPT Pro用户已经可以使用GPT-4.5模型,下周OpenAI将为Plus和Team用户推出。

本文素材来源OpenAI,如有侵权请联系删除

END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27687.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

unity pico开发二:连接头盔,配置手柄按键事件

文章目录 导入UnityXR Interaction ToolKit构建基础内容 导入UnityXR Interaction ToolKit 检查一下packagemanager,unityxr interactionToolkit是否自动导入 我们需要升级到一个不超过3.x的版本,因为pico还不支持3.x的内容 然后右侧samples里导入初始…

k8s架构及服务详解

目录 1.1.容器是什么1.2.Namespace1.3.rootfs5.1.Service介绍5.1.1.Serice简介 5.1.1.1什么是Service5.1.1.2.Service的创建5.1.1.3.检测服务5.1.1.4.在运行的容器中远程执行命令 5.2.连接集群外部的服务 5.2.1.介绍服务endpoint5.2.2.手动配置服务的endpoint5.2.3.为外部服务…

【含文档+PPT+源码】基于SpringBoot和Vue的编程学习系统

项目介绍 本课程演示的是一款 基于SpringBoot和Vue的编程学习系统,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。 1.包含:项目源码、项目文档、数据库脚本、软件工具等所有资料 2.带你从零开始部署运行本套系统 3.该…

【FL0090】基于SSM和微信小程序的球馆预约系统

🧑‍💻博主介绍🧑‍💻 全网粉丝10W,CSDN全栈领域优质创作者,博客之星、掘金/知乎/b站/华为云/阿里云等平台优质作者、专注于Java、小程序/APP、python、大数据等技术领域和毕业项目实战,以及程序定制化开发…

macos下myslq图形化工具之Sequel Ace

什么是Sequel Ace 官方github:https://github.com/Sequel-Ace/Sequel-Ace Sequel Ace 是一款快速、易于使用的 Mac 数据库管理应用程序,用于处理 MySQL 和 MariaDB 数据库。 Sequel Ace 是一款开源项目,采用 MIT 许可证。用户可以通过 Ope…

1.2.2 使用Maven方式构建Spring Boot项目

本次实战通过Maven方式构建了一个Spring Boot项目,实现了简单的Web应用。首先,创建了Maven项目并设置好项目名称、位置、构建系统和JDK等。接着,添加了Spring Boot的父项目依赖和web、thymeleaf起步依赖。然后,创建了项目启动类He…

Java【多线程】(2)线程属性与线程安全

目录 1.前言 2.正文 2.1线程的进阶实现 2.2线程的核心属性 2.3线程安全 2.3.1线程安全问题的原因 2.3.2加锁和互斥 2.3.3可重入(如何自己实现可重入锁) 2.4.4死锁(三种情况) 2.4.4.1第一种情况 2.4.4.2第二种情况 2.4…

[IP] DDR_FIFO(DDR3 用户FIFO接口)

IP(DDR_FIFO)将DDR3 IP的用户侧复杂接口修改为简易的FIFO接口,用户侧更加简易例化使用MIG 核 IP介绍 c0_xx (连接DDR app接口) 此IP 仅需根据MIG配置进行有限修改,即可使用! 关于IP详细使用说明,参考IP datasheet! 示…

USRP6330-通用软件无线电平台

1、产品描述 USRP6330平台以XILINX XCZU15EG SOC处理器为核心,搭配两片ADI ADRV9026射频集成芯片,提供了瞬时带宽高达200MHz的8收8发射频通道。通过驯服的高精度GPSDO时钟参考方案,USRP可以支持高性能的MIMO通信系统,提供了部署大…

P8615 [蓝桥杯 2014 国 C] 拼接平方数--substr、to_string、stoi

P8615 [蓝桥杯 2014 国 C] 拼接平方数--substr、to_string、stoi 题目 解析介绍一下这三个函数:1、to_string():2、stoi():3、substr():代码 题目 解析 首先…

一键安装Nginx部署脚本之Linux在线安装Nginx,脚本化自动化执行服务器部署(附执行脚本下载)

相关链接 一键安装Nginx部署脚本之Linux在线安装Nginx一键安装Redis部署脚本之Linux在线安装Redis一键安装Mysql部署脚本之Linux在线安装Mysql一键安装JAVA部署脚本之Linux在线安装JDKXshell客户端免费版无需注册XFtp客户端免费版无需注册 前言 简化服务器部署操作&#xff0…

反向代理以及其使用场景

一、反向代理概念 反向代理(Reverse Proxy)是一种服务器配置,它将客户端的请求转发给内部的另一台或多台服务器处理,然后将响应返回给客户端。与正向代理(Forward Proxy)不同,正向代理是客户端的代理,客户端将请求发送到代理服务器,再由代理服务器访问目标服务器;而…

Linux网络 NAT、代理服务、内网穿透

NAT 技术 IPv4 协议中存在 IP 地址数量不充足的问题,而 NAT 技术是当前解决 IP 地址不够用的主要手段 , 是路由器的一个重要功能。NAT 能够将私有 IP 对外通信时转为全局 IP,也就是就是一种将私有 IP 和全局 IP 相互转化的技术方法。 这可以让很多学…

广义线性模型下的数据分析(R语言)

一、实验目的: 通过上机试验,掌握利用R实现线性回归分析、逻辑回归、列联分析及方差分析,并能对分析结果进行解读。 数据: 链接: https://pan.baidu.com/s/1JqZ_KbZJEk-pqSUWKwOFEw 提取码: hxts 二、实验内容: 1、2…

Windows环境下Maven的配置

Windows环境下Maven的配置 一、Maven下载 Maven官网地址 apache-maven-3.8.8-bin.zip 二、安装和配置 解压到本地目录,例如:D:\software\apache-maven-3.8.8 新建变量MAVEN_HOMED:\software\apache-maven-3.8.8(以自己的安装路径为准&…

Spring MVC 处理请求

目录 1、SpringMVC 处理请求1.1、HTTP 请求报文1.2、获取 URL 中参数 PathVariable1.3、获取请求头数据1.3.1、传统获取 Header/Cookie1.3.2、获取 Header—RequestHeader1.3.3、获取 Cookie—CookieValue1.3.4、Session 的存储和获取—SessionAttribute 1.4、获取请求数据1.4.…

OpenAI 最后一代非推理模型:OpenAI 发布 GPT-4.5预览版

最后一代非推理大模型 在人工智能领域,OpenAI 一直以其创新的技术和卓越的产品引领着行业的发展。近期,OpenAI 正式发布了 GPT-4.5 研究预览版。不仅如此,官方还宣称 GPT-4.5 被定位为 “最后一代非推理模型”,这一消息再次引起了…

什么是JTAG、SWD?

一、什么是JTAG? JTAG(Joint Test Action Group,联合测试行动小组)是一种国际标准测试协议,常用于芯片内部测试及对系统进行调试、编程等操作。以下从其起源、工作原理、接口标准、应用场景等方面详细介绍&#xff1a…

知识周汇|SAP脚本自动化-淋过雨的人更懂得伞的价值

目录 摘要 1 知识概览 1.1SAP GUI脚本 1.2Tracker工具 2 实践案例 2.1步骤1:SAP启动并进入系统(文本关键) 2.1.1手动操作:鼠标双击SAP,并点击所需要系统 2.1.2代码实现 2.2步骤2:通过tracker完善后…

【GPU使用】如何在物理机和Docker中指定GPU进行推理和训练

我的机器上有4张H100卡,我现在只想用某一张卡跑程序,该如何设置。 代码里面设置 import os # 记住要写在impot torch前 os.environ[CUDA_VISIBLE_DEVICES] "0, 1"命令行设置 export CUDA_VISIBLE_DEVICES0,2 # Linux 环境 python test.py …