解密大模型与文心一言

近日，百度集团副总裁袁佛玉受邀出席数字纵深论坛并进行“解密大模型与文心一言“主题分享。

数字纵深论坛由北京大学光华管理学院数字教育中心主办，专注于分享科技前沿与商业洞见。

以下为分享精华回顾：

大家都能感受到，ChatGPT和百度文心一言这样的大模型非常火。今天我们就聊一聊，它爆火背后到底是什么原因？接下来还会发生什么？我们每个人、每家企业如何参与其中？

这个现象的发生，有一部分是在大家的设想之中，也有一部分在大家意料之外。甚至说，由于技术的快速发展，即使是身在其中的企业，对它的认知也在不断迭代中。很多新生事物的发展，有很大的不确定性，我们往往对它的发展方向有个大致的判断，然后需要在实践中探索获得积极反馈，才能不断地往前走，这就是“反馈驱动创新”的理念。

我们也希望跟大家一起，在新一波人工智能产业化浪潮中，共同去推动一些创新，推动人工智能技术的落地。

接下来，我重点讲一下大模型。这是当下最热、最前沿的人工智能发展方向。

ChatGPT爆火，AGI曙光初现

有媒体报道说：没有任何一次产业方向，行业这么快地达成共识。全球所有的大公司，都在往同一个方向去做——预训练大模型。

我们定义当下是人工智能发展的“拐点”，而不是“终点”。不是说，ChatGPT或者文心一言就是最终形态；而是说，它是人工智能发展到这个阶段产生的一个现象级产品。接下来，还会有非常多现象级的产品出现，还会有更多的突破发生。

这种基础设施级、操作系统级的创新，又意味着什么？让我们先回看一下历史——上面这张图，左边是中国过去40年GDP的增长曲线图；右边是过去2000年世界人均GDP的增长曲线图。我们可以看到，在人类发展历史中，有很长一段时间，人均GDP是不怎么增长的。但在最近的大约250年，GDP有了高速的、指数级的增长。这个增长就是人类历史上的三次科技革命带来的，是创新驱动增长，科技创新驱动了大的增长。

所以，对于当下我们所经历的现象，本质上是我们正在经历第四次工业革命。人工智能是第四次工业革命的核心驱动力量，标志性技术就是深度学习算法。这项技术能够驱动的经济增长，会比很多人想象得更大。当下大家看到的是一些热门的应用方向，但是接下来，它会重塑整个经济、社会、产业和人们生活的方方面面。

大模型智能涌现，人工智能迎来拐点

那为什么是今天？为什么是现在？

其实人工智能已经跌宕起伏，火了几十年。它有过很多次被社会层面认知，受追捧，然后又冷却，又重新再受追捧。大家应该都记得，当年Google的AlphaGo在围棋上打败李世石，就引发了巨大的关注。

那么，当下这波人工智能大浪潮有什么不同？我们知道，人工智能有三要素：算力、算法、数据。今天，这三个要素的齐头并进，让人工智能技术产生了本质性的改变，来到了一个临界点。

算法上的突破是最显著的，大模型背后核心技术就是深度学习算法。数据上看，2020-2025 年，全球数据平均增速预计达到23%。而且数据是越用越多，大量企业的数字化，还会不断产生更多的数据。在算力方面，2006年-2020年，芯片计算性能提升了600多倍，未来可能还会有更大的突破。今天大家还在讨论算力卡脖子，我们认为，到一定阶段算力也许都不是问题。

算力、算法、数据三方面共同的狂飙突进，成就了今天人工智能的拐点来临。

大模型带来了更高的生产效率：一是更少的训练数据。预训练开发模式可以把训练数据量减少90%；二是更少的算力投入，通过端到端训练和微调，算力投入可以减少90%；三是更短的开发周期。模型开发时间可以下降85%，从1周缩短到1天。

文心大模型

人工智能时代，应用会基于大模型来进行开发。

百度的文心大模型，是由百度智能云的AI大底座训练出来的。同时，AI大底座又包含了文心大模型的能力，并服务千行百业。

百度智能云的AI大底座，是全栈自研的，是一个全要素、端到端的AI基础设施，包括了推理芯片昆仑芯、基于产业实践的深度学习框架飞桨、文心大模型，还有上层的产业应用。

在这四层架构上，都能做端到端的优化，性能和效果、效率就能达到极致。比如说，千卡的加速比可以提升90%，资源的利用率可以提升70%，开发效率可以提升100%。

当我们讲百度文心大模型，我们要强调的是，它是产业级的知识增强大模型。

“产业级”，指的是我们的文心大模型是来自产业，应用于产业的大模型。它是在产业实际应用中真正产生价值的一个模型，这是我们非常有特色的一个地方。业界一些大模型，其实是既没有应用场景，也没有真正的用户和客户。

“知识增强”，指的是我们的文心大模型，它不仅从无监督的语料中学习知识，还通过百度多年积累的海量知识中学习。这些知识，是高质量的训练语料，有一些是人工精标的，有一些是自动生成的。比如搜索和点击数据，信息流上打的标签，这些都是经过大量的规则和模型训练优化过的数据。再比如，我们有全世界最大的中文知识图谱数据，有5500亿事实，这些都可以作为大模型的输入。文心大模型参数量非常大，达到了2600亿。

全球性AI再造拉开序幕

云计算游戏规则根本性改变

大模型浪潮，带来了全球性的AI再造。那它的本质是什么呢？是生产经营效率和用户体验效率的“双效”提升，这将加速社会的 “智能化跃迁”。

一个是从供给端来看，生产经营的效率将会得到极大提升。大模型和生成式AI已经可以帮我们写代码、写合同、写PPT。而接下来，多模融合的生成式AI，则会更深入地重塑我们生产的全流程。

另一个是从需求端来看，用户体验的效果将会得到极大提升。基于生成式AI的各种数字人，或者叫做个性化助理，会帮助我们解决健康、理财、法律等一系列问题；人和机器的交互界面也会更加自然、友好。除了生成文字之外，未来通过plug-in，就是接口的方式，你跟它讲讲话，它就可以上携程，帮你把酒店机票都订完了。对用户来讲，这个体验变得非常好，不用在各种APP之间跳转。

人工智能可以把所有的行业再造一遍。过去拥有优势的企业，可用它来巩固自己的优势。过去优势不很明显的企业，则有机会在新的阶段，用它来建立自己独特的竞争优势。

数以千计的创业公司，也正在用生成式AI来改造千行百业。全球性的AI再造已经势不可挡。每个企业需要重新思考，自己的优势是什么、如何用AI来放大这个优势。

文心一言大语言模型，会带来哪些创业机会、投资机会？我们认为，至少有三方面的机会。

一是新型云计算公司。我们认为，它适合少数大型科技公司，因为它需要大量的技术创新和突破+大量的人才+超大规模的数据+超大规模的算力，然后才能打磨出大语言模型，成本非常高。也没有必要每个公司都去搞一个大语言模型。大模型做得好的公司，它就会成为下一代的云计算领导者。

二是行业模型精调，是中间层，适合一些高科技创业公司，它可以基于通用大模型做一些有创造性的工作。除此之外，还有大型的集团型企业、集团中心、产业园区，也可以作为中间层的玩家。这几类公司，可以构建它所在行业的行业大模型，然后形成行业的数据闭环，根据业务需求对大模型进行精调，激发出大模型在行业里面的特定能力。

三是应用开发。这对所有的企业来说都有机会。那么这一层需要的核心能力是什么呢？是能够充分理解什么是大模型，然后对大模型充分利用，同时也对自己所在的场景，有产品能力和创新能力。

我们认为模型即服务，就是MaaS，它将撬动万亿级的市场。

中国的产业链非常丰富，我们本土产业会产生很多真实的场景和数据，这会反过来推动我们自己的大语言模型，不断地迭代和优化，最后会产生更大的价值，我们对此非常有信心。

在人工智能时代，我相信一定会出现杀手级的应用、现象级的新的产品，大家会不断地看到一个一个里程碑事件的发生。基于大语言模型的超级应用，未来创造的价值可能是移动互联网的10倍。

*本文由北大光华数字教育中心依据百度集团副总裁袁佛玉现场分享整理