AI智能新标尺:诺姆·布朗谈token成本革命

 

第一章:从德州扑克到AI革命——诺姆·布朗的“顿悟时刻”

1.1 从“人机对战”到“思维革命”

诺姆·布朗的AI研究生涯始于2012年卡内基梅隆大学的实验室。彼时,国际象棋AI“深蓝”已横扫棋坛,围棋AI“AlphaGo”初露锋芒,但非完美信息博弈(如德州扑克)仍是AI的“无人区”。布朗团队在2017年推出的Libratus,首次让AI在两人德州扑克中超越人类,但这并非终点——它仅能处理双人零和博弈,且依赖“预训练查找表”而非动态推理。

1.2 多人扑克的“不可能任务”

2019年,布朗在Meta开发的Pluribus将AI推向新高度:它能在六人德州扑克中击败人类顶级选手,且训练成本仅150美元。这一突破的关键在于,布朗发现“预训练与推理的平衡”远比单纯堆砌算力更重要。Pluribus在推理阶段使用28个CPU核心,每手牌耗时20秒,却实现了Libratus无法企及的多玩家博弈能力。布朗坦言:“当时没人意识到,推理计算能带来如此大的差异。”

第二章:基准测试的“数字幻觉”与AI圈的集体误判

2.1 从GPT-4到o1:一场算力军备竞赛的终结

过去五年,AI圈陷入“参数量竞赛”:GPT-3的1750亿参数、通义千问的万亿参数,甚至坊间传闻的“Q*”模型,似乎都在证明“更大即更好”。但布朗指出,这种“数字崇拜”已陷入误区。他以o1为例:这款推理模型并非参数量最大,却能通过“轻量预训练+深度推理”在复杂任务中击败对手。

2.2 基准测试的“测不准原理”

布朗在GTC演讲中犀利批判:“当前的基准测试就像用体重秤衡量运动员——参数量是静态的‘体重’,但真正的智能是动态的‘爆发力’。”他举例:若用传统基准测试对比o1与GPT-4,o1的参数量可能仅为后者1/10,但其推理能力却能完成后者无法处理的复杂逻辑推理。这种“单位token智能成本”(Intelligence per Token Cost)才是未来衡量标准。

第三章:推理优先:AI的“慢思考”革命

3.1 从“快思考”到“慢思考”的范式转移

布朗将AI思维分为两类:

  • System 1(快思考):依赖预训练的直觉反应,如语言生成、图像识别。
  • System 2(慢思考):通过推理逐步拆解复杂问题,如法律推理、战略规划。

o1的突破在于,它将System 2的推理能力模块化,使其能像人类一样“先思考、再行动”。例如,当用户要求o1设计一座桥梁时,它不会直接生成方案,而是先模拟材料强度、风力影响等变量,再输出结果——这种“思考痕迹”正是传统大模型缺失的环节。

3.2 预训练与推理的“动态平衡术”

布朗强调:“预训练是基础,但推理才是灵魂。”他透露,o1的预训练仅需数周,但推理阶段却能调用动态计算资源。例如,在处理法律文书时,模型会自动分配更多算力到条款解析模块;而在生成诗歌时,则转向语言流畅性优化。这种“按需分配”的设计,使o1的“token成本”仅为同类模型的1/3。

第四章:成本革命:AI的“性价比战争”

4.1 单位token成本:新战场的胜负手

布朗提出公式:
模型价值 = 智能输出 × (1 / 单位token成本)

以Pluribus为例,其推理阶段每token成本仅0.001美元,而传统蒙特卡洛树搜索需0.1美元/ token——效率差距达100倍。布朗认为,未来AI竞争将围绕“如何用更少token完成更复杂任务”展开。

4.2 从“算力军备”到“算法创新”

英伟达副总裁布莱恩·卡坦扎罗在对话中补充:“GPU的算力提升只是硬件层面的优化,真正的突破来自算法与系统架构的协同进化。”他举例,英伟达的Megatron系统通过模型并行技术,将o1的训练效率提升300%,而成本仅增加10%——这正是“单位token成本”思维的胜利。

第五章:未来已来——AI的“推理民主化”时代

5.1 开源与闭源的博弈:DeepSeek的启示

2024年,OpenAI的闭源策略引发行业不满,直到DeepSeek-R1开源其推理模型,证明“复现o1并非不可能”。布朗对此表示:“闭源或许能短期垄断技术,但开源生态才是AI进化的真正土壤。”他透露,o1的推理框架已开放部分接口,旨在推动行业共同优化“单位token成本”。

5.2 从实验室到现实:AI的“推理边界”

布朗最后展望了推理模型的三大应用场景:

  1. 医疗诊断:通过推理分析病历中的隐含矛盾,避免误诊。
  2. 气候建模:动态模拟减排政策对生态链的连锁影响。
  3. 教育领域:为学生提供“分步解题”而非单纯答案。

他总结:“AI的未来不在参数量的数字游戏,而在能否用最小的token成本,解决人类最复杂的思考任务。”

结语

诺姆·布朗的言论如同一记重锤,击碎了AI圈对“更大即更好”的迷信。从德州扑克到o1,从150美元的训练成本到“每token智能”新标准,他证明了:真正的AI革命,始于对“有效计算”的重新定义。当行业开始用成本而非参数丈量智能,或许我们离“强人工智能”更近了一步。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39207.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

碰一碰发视频系统开发者源码分析(一)

#碰一碰发视频系统# #碰一碰发视频saas系统#搭建 碰一碰发视频,是采用前沿技术搭载一套 AI 智能剪辑系统“碰一碰发视频”是一种基于近场通信(NFC)或蓝牙技术的创新交互方式,用户通过设备轻触即可触发视频传输或播放。本文将详细…

ROS2下MoveIt+Rviz+MuJoCo 三剑合璧!Panda 机械臂联动仿真!

视频讲解: ROS2下MoveItRvizMuJoCo 三剑合璧!Panda 机械臂联动仿真! 仓库代码:GitHub - LitchiCheng/ros2_package 今天介绍下,ros2下使用moveit在Rviz和mujoco联合仿真,结合上一期视频《MuJoCo 仿真 Pand…

Virtual BOX安装ubuntu及其环境配置(个人一些踩坑补充)

目录 设置中文操作界面和环境时候,下图内容切忌不要选错!安装过程中因为分辨率原因,可能安装界面无法显示全面,如何临时解决这篇文章中的缺少如何调出中文输出法部分unbuntu换源安装terminal终端小鱼一键ros安装opencv环境配置 ub…

基于Spring Boot的三国之家网站的设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…

二分图相关

判断二分图&#xff08;染色&#xff09; #include<bits/stdc.h> using namespace std; void __p(int x) {cerr<<x;} void __p(long long x){cerr<<x;} void __p(long double x){cerr<<x;} void __p(double x){cerr<<x;} void __p(string s){cer…

java执行jar包提示没有主清单属性

以前都没遇到过这种情况&#xff0c;什么时候打jar&#xff0c; war包都没有遇到过&#xff0c; 按照网上说的创建了META-INF/MANIFEST.MF 还是报错 于是检查下maven 打包发现&#xff1a;竟然有skip 为true 去掉 skip true &#xff0c;进行打包&#xff0c;编译后正常

运动仿真——phased.Platform

在雷达仿真过程中&#xff0c;运动仿真的必要性&#xff0c;以及运动仿真可以实现哪些功能&#xff0c;在matlab对应的user guide中已经讲的很清楚了&#xff0c;这里不再赘述。 本文主要介绍phased.Platform的一些“坑”&#xff0c;和典型的用法。 第一坑&#xff1a;系统对…

用selenium+ChromeDriver豆瓣电影 肖申克的救赎 短评爬取(pycharm 爬虫)

一、豆瓣电影 肖申克的救赎 短评url=https://movie.douban.com/subject/1292052/comments 二、基本知识点讲解 1. Selenium 的基本使用 Selenium 是一个用于自动化浏览器操作的库,常用于网页测试和爬虫。代码中使用了以下 Selenium 的核心功能: webdriver.Chrome: 启动 Chr…

万象更新(一)VTK 坐标轴、相机方向坐标轴、立方体坐标轴

VTK 坐标轴、相机方向坐标轴、立方体坐标轴 1. 坐标轴、相机方向坐标轴、立方体坐标轴2. 坐标轴3. 相机方向坐标轴4. 立方体坐标轴 1. 坐标轴、相机方向坐标轴、立方体坐标轴 在 VTK&#xff08;Visualization Toolkit&#xff09;中&#xff0c;与坐标轴相关的组件主要包括 坐…

【Golang】go语言上下文context

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全…

ROS2与OpenAI Gym集成指南:从安装到自定义环境与强化学习训练

1.理解 ROS2 和 OpenAI Gym 的基本概念 ROS2&#xff08;Robot Operating System 2&#xff09;&#xff1a;是一个用于机器人软件开发的框架。它提供了一系列的工具、库和通信机制&#xff0c;方便开发者构建复杂的机器人应用程序。例如&#xff0c;ROS2 可以处理机器人不同组…

基于Spring Boot的乡村养老服务管理系统的设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导&#xff0c;欢迎高校老师/同行前辈交流合作✌。 技术范围&#xff1a;SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容&#xff1a;…

### Java二维字符矩阵输入解析:正确读取由0和1组成的矩阵

在解决LeetCode等编程平台上的算法问题时&#xff0c;正确处理输入数据是解题的第一步。本文以Java语言为例&#xff0c;详细讲解如何正确读取由0和1组成的二维字符矩阵&#xff0c;并解决输入过程中可能遇到的换行符问题。 --- #### **问题背景** 题目要求从输入中读取一个二…

SEO监控看板搭建:基于Data Studio的实时数据可视化

在当今数字化营销的时代&#xff0c;SEO&#xff08;搜索引擎优化&#xff09;已经成为企业获取流量、提升品牌曝光的重要手段。然而&#xff0c;SEO的效果往往需要通过数据来评估和优化。为了更高效地监控SEO表现&#xff0c;许多企业开始使用数据可视化工具来搭建SEO监控看板…

模糊数学 | 模型 / 集合 / 关系 / 矩阵

注&#xff1a;本文为来自 “模糊数学 | 模型及其应用” 相关文章合辑。 略作重排。 如有内容异常&#xff0c;请看原文。 模糊数学模型&#xff1a;隶属函数、模糊集合的表示方法、模糊关系、模糊矩阵 wamg 潇潇 于 2019-05-06 22:35:21 发布 1.1 模糊数学简介 1965 年&a…

如何根据目标网站调整Python爬虫的延迟时间?

一、为什么需要调整爬虫的延迟时间&#xff1f; 1. 反爬虫机制的挑战 大多数网站&#xff08;尤其是电商平台如淘宝&#xff09;都部署了反爬虫机制&#xff0c;用于检测异常的访问行为。如果爬虫的请求频率过高&#xff0c;可能会触发以下反制措施&#xff1a; IP封禁&…

【嵌入式学习2】内存管理

## C语言编译过程 预处理&#xff1a;宏定义展开、头文件展开、条件编译&#xff0c;这里并不会检查语法&#xff0c;将#include #define这些头文件内容插入到源码中 gcc -E main.c -o main.i 编译&#xff1a;检查语法&#xff0c;将预处理后文件编译生成汇编文件&#xff…

案例分享|树莓派媒体播放器,重构商场广告的“黄金三秒”

研究显示&#xff0c;与传统户外广告相比&#xff0c;数字户外广告在消费者心中的记忆率提高了17%&#xff0c;而动态户外广告更是能提升16%的销售业绩&#xff0c;整体广告效率提升了17%。这一显著优势&#xff0c;使得越来越多资源和技术流入数字广告行业。 户外裸眼3D广告 无…

WindowsPE文件格式入门02.选项头其它和节表

https://www.bpsend.net/thread-444-1-1.html 选项头 IMAGE_OPTIONAL_HEADER&#xff1a;以供操作系统加载PE文件使用&#xff0c;32位必选。 重要字段&#xff1a; DWORD AddressOfEntryPoint&#xff1b; 入口点 DWORD ImageBase 建议模块地址…

【Arm+Qt+Opencv】基于人脸识别考勤系统实战

1.编译时问题汇总 windows下编译opencv-4.5.4 opencv-4.5.4编译 问题1&#xff1a;配套使用opencv-4.5.4,opencv_contrib-4.5.4,cmake3.22.3问题会少一点 问题2&#xff1a;在windows下哪里执行该命令 解决&#xff1a; 问题3&#xff1a;在对应cmake中搜索不到要修改的配置…