大模型技术工程师：抓住时代机遇，成为行业精英

伴随AI大模型的火热，中国科技大厂们正在掀起一场「跑步AI化」的风暴。从顶层战略到业务线重构，AI无疑已成为大厂们押注未来的新故事。

大模型时代已经到来

大模型已成为全球竞争热点，一个大模型时代已经到来。

大模型具备三个特点：规模大，需达到百亿参数级别；涌现性，能够产生预料之外的新能力；通用性，不限于专门问题或者领域。由于这三个特点的存在，以ChatGPT为例，ChatGPT采用“人类反馈的强化学习（RLHF）”方法，这使得ChatGPT能够理解和遵循人类指令，输出符合人类偏好的内容，这种特点使它适用于广大的应用领域。

GPT知识空间里，参数达到数百亿规模的复杂系统涌现现象“融会贯通”，虽然尚不可解释，但是确实存在。ChatGPT在多项考试中表现超过人类水平，具备能够根据纯文字说明，具备生成图像或草图的整合能力，也拥有高等数学/复杂数学问题求解的数学能力。GPT-4则大幅降低幻觉率，而据估算，当幻觉率达到5%以内，接近人类水平（保守），就可作为大模型规模商用落地的基准幻觉率。

人工智能生态包括基础软硬件、基础模型和创新应用三个层次。人工智能基础模型能够支撑赋智经济与社会各类应用，也将带动基础软硬件智算体系的发展。

从当前的产业现状来看，超大规模智能模型生态在全球屈指可数，其原因是受制于应用、数据量、算力、算法等因素。谷歌由于掌握核心专利、搜索引擎积累的海量数据、通过Android能够更好地服务移动用户等原因，而走在了前列。当成为大模型标志，接受了微软投资之后，OpenAI也脱颖而出。谁会是世界上大模型第三强呢？恐怕接下来比拼的就是生态，因此，人工智能之争最终是生态之争。

对于CIO们来说，2000年以前是信息（Information）时代，2020年以前是网络（Internet）时代，而2020年以后就属于智能（Intelligence）时代了。因此，CIO们接下来需要关注两个人工智能的重大转变，首先是从信息智能到实体智能，其次是从“静态融通”到“动态涌现”，未来有望通过类脑智能实现真正的AGI。

今天，ChatGPT有强大的智能，影响深远。未来3年，除了语言，大模型正在迅速扩展视觉、听觉、具身、行动等通用智能，影响将更大。未来10年，智力革命已经打响，就像工业革命解放体力，就像电力革命解决能源流通，智力革命将是全新生态的构建，开源开放生态终将胜利。未来20年，ChatGPT是数据驱动的静态智能，未来是时空环境驱动的具体智能，智能载体不是今天的人工神经网络，而是类脑的脉冲神经网络。到2045年，还会出现结构仿脑、功能类脑、性能超脑的超人“电子大脑”。

抢占优势领域，产品路径的「合」与「分」

大模型狂飙大半年以来，从模型端到应用端，一个共识是，最初由chatGPT所带来的大模型热潮已逐渐走过了令人热血沸腾的惊喜期，随着大批AI原生应用进入扩散期与大模型流入主流开发者中，如红杉资本在其报告中所定义的“生成式AI正在经历一个从技术驱动向客户驱动转变的过程。”

对中国的科技大厂们而言，在冷静期中，从抢技术到抢客户的转变，体现种种具体的动作中。

大厂们其中一类的策略就是对旧市场与旧业务的升级与重构，但从产品路径而言，也有微妙的异同。

相同点在于，大厂们都在利用AI夯实业务入口价值，不同点在于入口价值实现的路径差异。

阿里、腾讯与字节的动作主要是针对现有优势业务的「修补」。比如，在腾讯的优势阵地社交与泛娱乐领域，腾讯音乐曾推出AI社交产品「未伴」与机器人辅助创作功能，并同步测试「AI一起听」和AI伴侣「小琴」等。

阿里则率先在电商与生产力场景利用AI重塑业务。如淘宝目前在内测的AI原生应用「淘宝问问」，本质上是通过AI提升用户搜索行为的效率，实现AI导购的功能。而在学习办公场景，此前钉钉的AI PaaS化与夸克的AI化，也体现出阿里多条业务线正在全面接入AI能力。

字节跳动也低调地推出了两款「AI神器」——提供AI工具的小悟空（前身是悟空搜索）和AI对话产品「豆包」，又一口气在Github上发布两个AI视频项目，一个是多模态动画生成的MagicAvatar，另一个则是专注文本导向的视频编辑MagicEdit。

百度则野心更大，与OpenAI与微软的思路类似，通过插件构建生态，打造超级流量入口。

前不久百度发布了文心一言插件生态平台「灵境矩阵」，百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰将大模型与插件的关系定义为「大脑与手脚」：“如果大模型是一颗聪明的大脑，那么插件就是大模型的手和脚，有了插件，大模型不仅能回答通识问题，还能精通专业问题，既是通才、也是专才。”

不难看出，无论是基于原有的业务利用AI夯实入口价值，还是通过大模型插件打造超级流量入口，大厂们在原有庞大的用户基数下，集成大模型能力，降低AI的使用门槛，为后续的规模化应用做准备。

另一个相似点则是，将AI接入前端业务的「产品全家桶」。比如，百度在前端产品上，包括百度搜索、百度文库、百度输入法与文心一言APP都进行了升级，阿里也已实现了AI对旗下出行、娱乐、生活、办公、搜索等业务线产品的赋能。

与此同时，大厂们也在将自身云业务与AI结合，用AI更好地「卖云」。互联网云从早期举力做「集成商」到如今各司其职「被集成」的路线变化，自身优势技术产品与角色定位日益清晰。而随着大模型的落地，云厂商以MaaS（模型即服务）的模式既能一站式地实现产品的标准化，更好地落地行业，又能对外输出AI能力与AI算力，提升利润健康表现。

据「硅基研究室」的不完全统计，今年8月至今，阿里云、腾讯云在政务、金融等领域收获多个大单，展现出强势姿态。其中，阿里云拿下了8月份市场上最大的项目——浙江省大数据发展管理局政务云资源租赁-云服务项目，该项目金额达到了2.68亿元。而在10月，阿里云中标京能国际9亿AI算力大单。

一位百度智能云人士此前在接受《财经十一人》采访时也提到，百度追求销售标准产品，希望更聪明地做集成。因此，更多从行业、场景实际需求出发，帮部分客户提供必要的集成服务。

可以肯定的是，大厂跑步AI化，从具体实现路径来看并没有明显的差异，原因在于AI对当下的业务重构是并非一个静态的过程，而是需要一定的周期。

AI应用的深度与广度，背后依赖大厂内部算力等资源的调配、业务的优先级等，这之中，不乏一些不确定的因素。一个典型例子就是近期宣布离职创业的百度副总裁、小度原CEO景鲲。作为百度AI生态落地的重要之一，关键人物「小度之父」的离职也为这家独角兽未来的走向增添了更多的不确定性。

大模型时代的机遇

生成式AI在中国也发展地十分迅速。如阿里、百度、讯飞等大公司，以及许多初创公司都已经进入了这个领域。然而，随着越来越多的大模型的出现，我们不禁要问：它们的优势到底在哪里？真正的应用价值和产业价值在哪里？

1、有护城河吗？

人们常常会问，这个领域是否存在护城河呢？（是否有供应链、是否有生态、是否有数据？）目前看来，这个领域发展地非常快，还没有形成系统性的护城河。公司规模是护城河么？不一定是。例如，在ChatGPT出现之前，我们从未想过，像Google这样的大搜索公司会受到一家创业公司的冲击。尽管OpenAI很出名，但与Google相比，无论是在工程师数量、系统复杂性还是产品影响力上，都不在一个量级。可以看到，生成式人工智能可以让一个相对初创公司对大规模公司产生非常有力的冲击。微软和OpenAI的结合又打造了一个非常优秀的联盟。

在这个领域中，新的算法层出不穷，但随着算法的发表和开源，单个算法创新不是护城河。数据非常重要。从数据角度而已，生成式人工智能是在收集整个互联网的数据做一个压缩。传统的网上公开数据已经不再构成护城河。

未来的发展方向可能是在场景中打造真正需要的产品，将产品、算法和工程系统真正地结合起来。OpenAI的创始人在采访中提到，ChatGPT的成功并不是一个单点技术的成功，而是一个系统化的结合。

2、价值将在哪里积累？

当前，生成式人工智能总营收的10%-20%将流向云服务提供商，而应用程序公司平均将20%-40%的年收入用于推理和定制化的微调，同时模型提供商也将一半的收入投入到云基础设施上。在这个过程中，最大的赢家是生产硬件的公司。因为，无论是哪一家公司，它在快速迭代和探索中，都会有一个共同的依赖，那就是底层对GPU卡的需求。就目前来看，直接看到的最大收益者是GPU的生产商和云厂商。

3、谁与争锋？

1）大模型技术能对企业产生重大影响

一家值得关注的公司是Midjourney。这家公司在2021年成立，不到一年的时间就吸引了千万级别的用户，并在去年实现了过亿美元的营收。这家公司的员工数量极少，今年上半年只有11名员工，其中4名本科在读，8名研发工程师，另外3名员工负责法务、财务和后台工作。然而，这家公司产生的图片质量却非常高，覆盖了建筑设计、平面设计、用户界面设计和技术创作等多个领域。这家公司打破了“规模决定一切”的传统观念，向我们证明了少量的员工也能产生巨大的影响力和价值。从这个案例中，我们可以看到大模型技术能对企业发展产生非常大的影响。

2）大模型的产业应用

国内市场也正经历着非常迅速的发展。预计在2022年至2025年间，其年化增长率将超过40%，这是一个惊人的数字。人工智能未来在金融、医疗、教育、游戏设计等行业应用落地有不少空间。

3）大模型的应用边界

在过去的几个月里，大语言模型的应用边界得到了极大的拓展，其中一个焦点是代理（agent）。代理是指在大语言模型基础上增加规划、反馈和使用工具的能力。它作为大模型与场景间价值传递的桥梁，能极大地拓展大模型的应用边界，使其成为一种系统性的超级应用。

只有大公司才能做大模型吗？我认为并不是这样。小模型可以知识蒸馏。虽然现在大多讨论的是千亿模型参数、万亿模型参数，但我们发现，在某些特定领域，百亿、甚至十亿级的模型参数就能取得很好的效果。此外，国产替代也正在逐渐发挥作用。

4、大模型作为生产力工具的挑战

然而，大模型在真正转化为生产力的过程中会面临一系列挑战。

首先，在生成能力上，如何实现可信可靠，避免出现“幻觉效应”？其次，对于复杂的应用场景，如何实现信息的动态集成？这包括代理如何调用外部数据库？大模型本身如何快速、动态地集成和更新？这些都是技术领域的挑战。此外，海量数据的获取和算力方面也需要重点关注。据MIT团队预测，在2026年，我们可用的公开数据将全部耗尽。那么，未来的数据将从何处获取？如何获得大规模的算力支持？这些都是需要解决的问题。