AI 领域再次震动,一款全新的深度思考大型语言模型正式亮相。它不仅碾压了现有的各项基准测试,还成功登顶 LM Marina 排行榜,夺得第一名。这款 AI 不是别人,正是埃隆·马斯克那款“基于事实、敢言无忌”的 Grok 3——一个号称既极为聪明,又几乎不受审查的模型。
与受严格审核政策限制的其他 AI 模型不同,Grok 3 突破了许多界限,甚至可以生成在多个国家和地区非法的内容。它具备类似于 DeepSeek 1 的“深度思考模式”,据称还能生成文本到视频的内容。更值得关注的是,它未来将推出一个升级版——Super Grok,作为付费订阅服务提供,承诺拥有更强大的能力。
但对于许多用户来说,这需要付出额外的代价。目前,已经订阅 Twitter Premium Plus 以使用 Grok 3 的用户,现在被要求再支付额外费用才能访问 Super Grok。有人认为,这一举动让他们感到被“割韭菜”。那么,Grok 3 真的值得这么多关注吗?在今天的报道中,我们将深入探讨这款 AI 的特别之处、它的训练方式,以及它是否真的堪称全球最强 LLM(大型语言模型)。
AI 霸主之争:马斯克 vs. OpenAI
今天是 2025 年 2 月 18 日,欢迎收看 The Code Report。过去一周,AI 行业议论纷纷。埃隆·马斯克在社交媒体上对 OpenAI 发起了“挑衅”,甚至开出了收购 OpenAI 的提议。但毫无悬念,OpenAI 董事会迅速回绝了这一提案,而 CEO 山姆·奥特曼 仍坚定地推动 OpenAI 向盈利巨头发展,并有望获得巨额收益。
但 AI 霸权之争异常残酷。上周,马克·扎克伯格遭遇重大打击——有人爆料他的公司在训练 Llama 模型时,使用了 82TB 的盗版书籍,这些数据来自 ber Library Genesis,一个包含数百万本书籍和付费论文的非法资源库。这一消息让不少人感到震惊,但熟悉扎克伯格“黑历史”的人却并不意外。
Grok 3 的独特之处是什么?
Grok 3 的一大优势是它可以直接访问 Twitter 的实时数据流。相比那些依赖经过筛选数据集的 AI,Grok 3 可以直接从社交平台的海量讨论中提取信息。据 X.AI 开发者称,这使得 Grok 3 能够优先追求“最大化的真相”,即使这意味着它会忽略政治正确性。
这种“不受审查”的特性让 Grok 3 能做到其他 AI 不能做的事,比如生成名人图像或创作带有争议性的诗歌。在一个实验中,研究人员向多个 LLM 提出了相同的政治敏感问题,结果只有 Grok 3 没有屏蔽请求,甚至给出的答案过于极端,以至于无法在社交媒体上展示。
尽管如此,Grok 3 仍计划在德国、英国等言论法规更严格的国家上线。这一举措让许多“网络狂热者”欢呼,但同时也引发了严重的道德争议。
Grok 3 有多强?
目前,Grok 3 位居 LM Marina 排行榜首位,该榜单基于人类对不同 LLM 的盲测评分。从这些测试来看,Grok 3 确实表现惊人。其他基准测试也显示,Grok 3 在数学、科学和编程方面超过了 Gemini、Claude、DeepSeek 和 GPT-4。
但这里有一个问题——OpenAI 的最新模型 GPT-4o 被刻意排除在对比之外。当 GPT-4o 被纳入评测后,整体排名发生了巨大变化。此外,某些关键测试(如 Codeforces 和 ARC-AGI)也未被纳入,这让人怀疑 Grok 3 是否在“选择性比较”以获得更好的结果。
最终,最重要的标准还是 实际应用能力。在实践测试中,Grok 3 能一次性生成有效的 Spell 5 代码,并帮助开发者在 Godot 引擎 中构建游戏。这表明它的性能虽然强大,但并没有完全超越其他最先进的 AI,而是达到了相同的水准。
AI 的未来:更大的模型,还是更好的策略?
近年来,AI 研究的重点已经从单纯“扩大模型规模”转向优化提示词框架(Prompting Framework)。例如,“深度研究模式”(Deep Research Mode)和“大脑模式”(Big Brain Mode)等新概念,旨在提升 AI 推理能力,而不需要指数级增加算力消耗。
Grok 3 的训练过程也充满看点。它是在美国孟菲斯的“巨像超级计算机”(Colossus Supercomputer) 上训练的。这台计算机据称是全球最大 AI 超算,配备 20 万块 Nvidia H100 GPU,未来甚至计划扩展到 100 万块。由于功耗巨大,它甚至需要依靠便携式柴油发电机维持运转。
即将推出的 Super Grok 预计订阅费用为 30 美元/月,相比 ChatGPT Pro 的 200 美元/月 便宜许多。但考虑到开发者已经在支付 Claude、Gemini、Copilot、Codium、Midjourney 和 WatsonX 的订阅费,再加一个 AI 订阅服务可能不会那么有吸引力。
总结
AI 正在飞速发展,Grok 3 无疑是这一竞争中的重要角色。它的不受审查特性和对实时数据的直接访问,使它与众不同。但同时,它的基准测试透明度和道德问题仍存争议。
随着 AI 争霸战愈演愈烈,有一件事是可以确定的:马斯克、奥特曼和扎克伯格之间的竞争,只会变得更加激烈。