Grok 3 的崛起：AI 的新时代

AI 领域再次震动，一款全新的深度思考大型语言模型正式亮相。它不仅碾压了现有的各项基准测试，还成功登顶 LM Marina 排行榜，夺得第一名。这款 AI 不是别人，正是埃隆·马斯克那款“基于事实、敢言无忌”的 Grok 3——一个号称既极为聪明，又几乎不受审查的模型。

与受严格审核政策限制的其他 AI 模型不同，Grok 3 突破了许多界限，甚至可以生成在多个国家和地区非法的内容。它具备类似于 DeepSeek 1 的“深度思考模式”，据称还能生成文本到视频的内容。更值得关注的是，它未来将推出一个升级版——Super Grok，作为付费订阅服务提供，承诺拥有更强大的能力。

但对于许多用户来说，这需要付出额外的代价。目前，已经订阅 Twitter Premium Plus 以使用 Grok 3 的用户，现在被要求再支付额外费用才能访问 Super Grok。有人认为，这一举动让他们感到被“割韭菜”。那么，Grok 3 真的值得这么多关注吗？在今天的报道中，我们将深入探讨这款 AI 的特别之处、它的训练方式，以及它是否真的堪称全球最强 LLM（大型语言模型）。

AI 霸主之争：马斯克 vs. OpenAI

今天是 2025 年 2 月 18 日，欢迎收看 The Code Report。过去一周，AI 行业议论纷纷。埃隆·马斯克在社交媒体上对 OpenAI 发起了“挑衅”，甚至开出了收购 OpenAI 的提议。但毫无悬念，OpenAI 董事会迅速回绝了这一提案，而 CEO 山姆·奥特曼仍坚定地推动 OpenAI 向盈利巨头发展，并有望获得巨额收益。

但 AI 霸权之争异常残酷。上周，马克·扎克伯格遭遇重大打击——有人爆料他的公司在训练 Llama 模型时，使用了 82TB 的盗版书籍，这些数据来自 ber Library Genesis，一个包含数百万本书籍和付费论文的非法资源库。这一消息让不少人感到震惊，但熟悉扎克伯格“黑历史”的人却并不意外。

Grok 3 的独特之处是什么？

Grok 3 的一大优势是它可以直接访问 Twitter 的实时数据流。相比那些依赖经过筛选数据集的 AI，Grok 3 可以直接从社交平台的海量讨论中提取信息。据 X.AI 开发者称，这使得 Grok 3 能够优先追求“最大化的真相”，即使这意味着它会忽略政治正确性。

这种“不受审查”的特性让 Grok 3 能做到其他 AI 不能做的事，比如生成名人图像或创作带有争议性的诗歌。在一个实验中，研究人员向多个 LLM 提出了相同的政治敏感问题，结果只有 Grok 3 没有屏蔽请求，甚至给出的答案过于极端，以至于无法在社交媒体上展示。

尽管如此，Grok 3 仍计划在德国、英国等言论法规更严格的国家上线。这一举措让许多“网络狂热者”欢呼，但同时也引发了严重的道德争议。

Grok 3 有多强？

目前，Grok 3 位居 LM Marina 排行榜首位，该榜单基于人类对不同 LLM 的盲测评分。从这些测试来看，Grok 3 确实表现惊人。其他基准测试也显示，Grok 3 在数学、科学和编程方面超过了 Gemini、Claude、DeepSeek 和 GPT-4。

但这里有一个问题——OpenAI 的最新模型 GPT-4o 被刻意排除在对比之外。当 GPT-4o 被纳入评测后，整体排名发生了巨大变化。此外，某些关键测试（如 Codeforces 和 ARC-AGI）也未被纳入，这让人怀疑 Grok 3 是否在“选择性比较”以获得更好的结果。

最终，最重要的标准还是实际应用能力。在实践测试中，Grok 3 能一次性生成有效的 Spell 5 代码，并帮助开发者在 Godot 引擎中构建游戏。这表明它的性能虽然强大，但并没有完全超越其他最先进的 AI，而是达到了相同的水准。

AI 的未来：更大的模型，还是更好的策略？

近年来，AI 研究的重点已经从单纯“扩大模型规模”转向优化提示词框架（Prompting Framework）。例如，“深度研究模式”（Deep Research Mode）和“大脑模式”（Big Brain Mode）等新概念，旨在提升 AI 推理能力，而不需要指数级增加算力消耗。

Grok 3 的训练过程也充满看点。它是在美国孟菲斯的“巨像超级计算机”（Colossus Supercomputer）上训练的。这台计算机据称是全球最大 AI 超算，配备 20 万块 Nvidia H100 GPU，未来甚至计划扩展到 100 万块。由于功耗巨大，它甚至需要依靠便携式柴油发电机维持运转。

即将推出的 Super Grok 预计订阅费用为 30 美元/月，相比 ChatGPT Pro 的 200 美元/月便宜许多。但考虑到开发者已经在支付 Claude、Gemini、Copilot、Codium、Midjourney 和 WatsonX 的订阅费，再加一个 AI 订阅服务可能不会那么有吸引力。