大模型只是轮子，与其闭门重复造轮子，不如深耕场景应用

如何理解李彦宏说的“不要卷模型，要卷应用”

7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议全体会议在上海世博中心举办。在产业发展主论坛上，百度创始人、董事长兼首席执行官李彦宏呼吁：“大家不要卷模型，要卷应用！”李彦宏认为，AI技术已经从辨别式转向了生成式，但技术本身并不是目的，真正的价值在于如何将这些技术应用于实际场景，解决实际问题。并且提醒大家避免掉入“超级应用陷阱”，即过分追求用户日活跃量（DAU）而忽视了应用的实际效果和产业价值。称AI时代的规律可能不同于移动时代，一个“超级能干”的应用即使DAU不高，只要能为产业带来实质性的增益，其价值就远超传统的移动互联网。

一、“轮子”造价不斐

大模型的开发成本是一个相对较高的数字，具体的数值会受到多种因素的影响。可能影响大模型开发成本的因素包括但不限于以下方面：

数据收集和准备：为了训练大模型，通常需要大量的数据。收集、清洗和准备数据可能需要耗费大量的时间和人力资源。
硬件和基础设施：大模型通常需要更强大的计算资源和存储空间。如果没有合适的硬件基础设施，可能需要购买或租赁适当的服务器、GPU 或云计算实例。
研发团队：大模型的开发通常需要一个有经验的团队，其中包括数据科学家、工程师和研究人员等。团队成员的数量和专业水平将直接影响开发成本。
算法和模型设计：大模型的开发可能需要独特的算法和模型设计，这可能需要额外的研究和试验，也会增加开发成本。
训练和调试时间：训练一个大模型可能需要很长的时间，特别是在没有足够的计算资源时。同时，为了使模型达到最佳性能，可能需要花费大量的时间进行调试和优化。

综上所述，大模型的开发成本很难给出一个具体的数字，因为它受到众多因素的影响。但是通常来说，大模型的开发成本往往会比较高。

投入高成本打造的大模型是驴是马？还是得拉出来溜溜，通过应用来验证，风险比较大。

二、现有的“轮子”够用吗？

根据公开报道，目前有多家公司和研究机构正在开发和使用大规模模型。其中，OpenAI开发的大规模语言模型GPT-3是目前最著名的大模型之一。另外，谷歌、Facebook、微软等公司以及一些研究机构也在开发类似规模的模型。这些企业开发的大模型已经成为当前最流行的大模型：

GPT-3（Generative Pre-trained Transformer 3）：GPT-3是由OpenAI开发的自然语言处理模型，具有1750亿个参数，可以生成高质量的文本。
BERT（Bidirectional Encoder Representations from Transformers）：BERT是谷歌开发的自然语言处理模型，具有3.3亿个参数，可以用于文本分类、命名实体识别等任务。
T5（Text-to-Text Transfer Transformer）：T5是谷歌开发的多任务自然语言处理模型，具有11亿个参数，可以用于多种文本相关任务，如机器翻译、文本摘要等。
BigGAN（Big Generative Adversarial Networks）：BigGAN是由OpenAI开发的图像生成模型，具有7.5亿个参数，可以生成高分辨率、逼真的图像。
GPT-2（Generative Pre-trained Transformer 2）：GPT-2是由OpenAI开发的自然语言处理模型，具有1.5亿个参数，可以生成高质量的文本。

这些大模型在各自领域内具有重要的影响力，广泛应用于自然语言处理、图像生成等任务中。

而且这些大模型大多数是开源的。开源大模型的出现对于科研社区和开发者来说是一个重大的进步，它们可以更轻松地使用和扩展这些模型，从而加速研究和开发的进程。开源大模型的开放性也促进了模型的迭代和改进，使得整个社区能够共同参与到模型的发展和优化过程中。