谷歌大型推理模型曝光！击败Claude-3.7-Thinking

谷歌大型推理模型曝光！击败Claude-3.7-Thinking

news/2025/3/26 14:35:18/文章来源:https://blog.csdn.net/xixiaoyaoww/article/details/146489193

哎！最近推特上的网友在LMSYS Arena 发现了个泄漏的大模型 Nebula，效果据说特别好，打败了o1、o3-mini、Claude 3.7 Thinking等模型：

网友们通过询问和分析 API，发现这似乎是谷歌正在秘密测试的新推理模型！推测可能是 Gemini 2.0 Pro Thinking：

首先，从 API 显示的信息来看，这是一款 Gemini 测试模型：

随后，网友们开始询问该模型，试图获取更多信息。

确定是 Google 模型无疑！

那它的表现究竟如何？网友们直呼牛逼的效果到底是不是真实的呢！小鹿去访问 Arena 时，模型已悄然下线。现在只能参考网友们的测试了～

网友测了一个这样的问题：

我有一个 7 升的金属桶，底部有一个孔，另一端有一块金属板，用于密封。我可以在里面储存多少水？

Nebula的输出：

这个问题只是一个非常简单的提示，大型模型想要取得成功实际上其实非常困难。

简单问题往往隐含大量人类默认的常识和物理直觉，而人工智能仅通过文本学习，缺乏真实世界的体验。

例如"底部有孔的桶能储水吗？"

对人类而言，孔→重力→漏水→零储存是瞬间完成的因果链，但模型需要从碎片化文本中重组逻辑：既要解析"密封另一端"是否指顶部（影响水流路径），又要过滤训练数据中可能存在的矛盾案例（如文学作品中"用破桶打水"的比喻）。

这种简单背后复杂的隐性知识网络，恰是当前人工智能最易迷失的认知盲区。

不妨看看其他模型的表现，比如DeepSeeK：

DeepSeek根本没有认识到问题的本质是在于模型能不能“想”到将桶颠倒过来。

GPT-4.5:

GPT-4.5 也翻车了！

还有网友用Nebula写科幻题材的小说：

结尾反转很妙！对话也写得生动有趣，寥寥几笔就勾勒出一个有意思的故事，感觉Nebula除了会算，也确实很会写！

目前根据网友们的挖掘，这个模型确实很值得期待哎！

就在最近，用户在Gemini悬浮窗中还意外发现“与Live共享屏幕”按钮，“误打误撞”发现了谷歌为Gemini Live推出的全新AI实时视频功能！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/39220.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

css-grid布局

css-grid布局

文章目录 1、布局2、网格轨道3、间距Gap4、网格线5、网格别名当一个 HTML 元素将 display 属性设置为 grid 或 inline-grid 后，它就变成了一个网格容器，这个元素的所有直系子元素将成为网格元素。 1、布局启用grid布局类似与flex布局，不过g…

阅读更多...

菱形虚拟继承的原理

菱形虚拟继承的原理

一 ：菱形继承的问题普通的菱形继承存在数据冗余和二义性的问题 ，如下代码： class Person { public:string _name; //姓名 };class Student : public Person { protected:int _num; //学号 };class Teacher : public Person { protected:int…

阅读更多...

＜数据集＞轨道异物识别数据集＜目标检测＞

＜数据集＞轨道异物识别数据集＜目标检测＞

数据集下载链接：https://download.csdn.net/download/qq_53332949/90527370 数据集格式：VOCYOLO格式图片数量：1659张标注数量(xml文件个数)：1659 标注数量(txt文件个数)：1659 标注类别数：6 标注类别…

阅读更多...

高效PDF翻译解决方案：多引擎支持+格式零丢失

高效PDF翻译解决方案：多引擎支持+格式零丢失

软件介绍在AI翻译工具大行其道的今天，传统翻译软件市场逐渐饱和，但专业领域的深度需求依然存在。本文推荐的PDF翻译工具凭借20余种专业翻译接口，为学术文献、技术文档等复杂内容提供更精准的翻译服务，在保留文档原始排版的同时…

阅读更多...

AI智能新标尺：诺姆·布朗谈token成本革命

AI智能新标尺：诺姆·布朗谈token成本革命

第一章：从德州扑克到AI革命——诺姆布朗的“顿悟时刻” 1.1 从“人机对战”到“思维革命” 诺姆布朗的AI研究生涯始于2012年卡内基梅隆大学的实验室。彼时，国际象棋AI“深蓝”已横扫棋坛，围棋AI“AlphaGo”初露锋芒，但非完美信息…

阅读更多...

碰一碰发视频系统开发者源码分析（一）

碰一碰发视频系统开发者源码分析（一）

#碰一碰发视频系统# #碰一碰发视频saas系统#搭建碰一碰发视频，是采用前沿技术搭载一套 AI 智能剪辑系统“碰一碰发视频”是一种基于近场通信（NFC）或蓝牙技术的创新交互方式，用户通过设备轻触即可触发视频传输或播放。本文将详细…

阅读更多...

ROS2下MoveIt+Rviz+MuJoCo 三剑合璧！Panda 机械臂联动仿真！

ROS2下MoveIt+Rviz+MuJoCo 三剑合璧！Panda 机械臂联动仿真！

视频讲解： ROS2下MoveItRvizMuJoCo 三剑合璧！Panda 机械臂联动仿真！ 仓库代码：GitHub - LitchiCheng/ros2_package 今天介绍下，ros2下使用moveit在Rviz和mujoco联合仿真，结合上一期视频《MuJoCo 仿真 Pand…

阅读更多...

Virtual BOX安装ubuntu及其环境配置（个人一些踩坑补充）

Virtual BOX安装ubuntu及其环境配置（个人一些踩坑补充）

目录设置中文操作界面和环境时候，下图内容切忌不要选错！安装过程中因为分辨率原因，可能安装界面无法显示全面，如何临时解决这篇文章中的缺少如何调出中文输出法部分unbuntu换源安装terminal终端小鱼一键ros安装opencv环境配置 ub…

阅读更多...

基于Spring Boot的三国之家网站的设计与实现（LW+源码+讲解）

基于Spring Boot的三国之家网站的设计与实现（LW+源码+讲解）

专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌。技术范围：SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：…

阅读更多...

二分图相关

二分图相关

判断二分图（染色） #include<bits/stdc.h> using namespace std; void __p(int x) {cerr<<x;} void __p(long long x){cerr<<x;} void __p(long double x){cerr<<x;} void __p(double x){cerr<<x;} void __p(string s){cer…

阅读更多...

java执行jar包提示没有主清单属性

java执行jar包提示没有主清单属性

以前都没遇到过这种情况，什么时候打jar， war包都没有遇到过， 按照网上说的创建了META-INF/MANIFEST.MF 还是报错于是检查下maven 打包发现：竟然有skip 为true 去掉 skip true ，进行打包，编译后正常

阅读更多...

运动仿真——phased.Platform

运动仿真——phased.Platform

在雷达仿真过程中，运动仿真的必要性，以及运动仿真可以实现哪些功能，在matlab对应的user guide中已经讲的很清楚了，这里不再赘述。本文主要介绍phased.Platform的一些“坑”，和典型的用法。第一坑：系统对…

阅读更多...

用selenium+ChromeDriver豆瓣电影肖申克的救赎短评爬取（pycharm 爬虫）

用selenium+ChromeDriver豆瓣电影肖申克的救赎短评爬取（pycharm 爬虫）

一、豆瓣电影肖申克的救赎短评url=https://movie.douban.com/subject/1292052/comments 二、基本知识点讲解 1. Selenium 的基本使用 Selenium 是一个用于自动化浏览器操作的库，常用于网页测试和爬虫。代码中使用了以下 Selenium 的核心功能： webdriver.Chrome: 启动 Chr…

阅读更多...

万象更新（一）VTK 坐标轴、相机方向坐标轴、立方体坐标轴

万象更新（一）VTK 坐标轴、相机方向坐标轴、立方体坐标轴

VTK 坐标轴、相机方向坐标轴、立方体坐标轴 1. 坐标轴、相机方向坐标轴、立方体坐标轴2. 坐标轴3. 相机方向坐标轴4. 立方体坐标轴 1. 坐标轴、相机方向坐标轴、立方体坐标轴在 VTK（Visualization Toolkit）中，与坐标轴相关的组件主要包括坐…

阅读更多...

【Golang】go语言上下文context

【Golang】go语言上下文context

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯，先赞后看哦~🎈🎈 🏆 作者简介：景天科技苑 🏆《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。 🏆《博客》：Python全…

阅读更多...

ROS2与OpenAI Gym集成指南：从安装到自定义环境与强化学习训练

ROS2与OpenAI Gym集成指南：从安装到自定义环境与强化学习训练

1.理解 ROS2 和 OpenAI Gym 的基本概念 ROS2（Robot Operating System 2）：是一个用于机器人软件开发的框架。它提供了一系列的工具、库和通信机制，方便开发者构建复杂的机器人应用程序。例如，ROS2 可以处理机器人不同组…

阅读更多...

基于Spring Boot的乡村养老服务管理系统的设计与实现（LW+源码+讲解）

基于Spring Boot的乡村养老服务管理系统的设计与实现（LW+源码+讲解）

专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌。技术范围：SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：…

阅读更多...

### Java二维字符矩阵输入解析：正确读取由0和1组成的矩阵

### Java二维字符矩阵输入解析：正确读取由0和1组成的矩阵

在解决LeetCode等编程平台上的算法问题时，正确处理输入数据是解题的第一步。本文以Java语言为例，详细讲解如何正确读取由0和1组成的二维字符矩阵，并解决输入过程中可能遇到的换行符问题。 --- #### **问题背景** 题目要求从输入中读取一个二…

阅读更多...

SEO监控看板搭建：基于Data Studio的实时数据可视化

SEO监控看板搭建：基于Data Studio的实时数据可视化

在当今数字化营销的时代，SEO（搜索引擎优化）已经成为企业获取流量、提升品牌曝光的重要手段。然而，SEO的效果往往需要通过数据来评估和优化。为了更高效地监控SEO表现，许多企业开始使用数据可视化工具来搭建SEO监控看板…

阅读更多...

模糊数学 | 模型 / 集合 / 关系 / 矩阵

模糊数学 | 模型 / 集合 / 关系 / 矩阵

注：本文为来自 “模糊数学 | 模型及其应用” 相关文章合辑。略作重排。如有内容异常，请看原文。模糊数学模型：隶属函数、模糊集合的表示方法、模糊关系、模糊矩阵 wamg 潇潇于 2019-05-06 22:35:21 发布 1.1 模糊数学简介 1965 年&a…

阅读更多...

最新文章

推荐文章