如何理解李彦宏说的“不要卷模型,要卷应用”
7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议全体会议在上海世博中心举办。在产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏呼吁:“大家不要卷模型,要卷应用!”李彦宏认为,AI技术已经从辨别式转向了生成式,但技术本身并不是目的,真正的价值在于如何将这些技术应用于实际场景,解决实际问题。并且提醒大家避免掉入“超级应用陷阱”,即过分追求用户日活跃量(DAU)而忽视了应用的实际效果和产业价值。称AI时代的规律可能不同于移动时代,一个“超级能干”的应用即使DAU不高,只要能为产业带来实质性的增益,其价值就远超传统的移动互联网。
一、“轮子”造价不斐
大模型的开发成本是一个相对较高的数字,具体的数值会受到多种因素的影响。可能影响大模型开发成本的因素包括但不限于以下方面:
-
数据收集和准备:为了训练大模型,通常需要大量的数据。收集、清洗和准备数据可能需要耗费大量的时间和人力资源。
-
硬件和基础设施:大模型通常需要更强大的计算资源和存储空间。如果没有合适的硬件基础设施,可能需要购买或租赁适当的服务器、GPU 或云计算实例。
-
研发团队:大模型的开发通常需要一个有经验的团队,其中包括数据科学家、工程师和研究人员等。团队成员的数量和专业水平将直接影响开发成本。
-
算法和模型设计:大模型的开发可能需要独特的算法和模型设计,这可能需要额外的研究和试验,也会增加开发成本。
-
训练和调试时间:训练一个大模型可能需要很长的时间,特别是在没有足够的计算资源时。同时,为了使模型达到最佳性能,可能需要花费大量的时间进行调试和优化。
综上所述,大模型的开发成本很难给出一个具体的数字,因为它受到众多因素的影响。但是通常来说,大模型的开发成本往往会比较高。
投入高成本打造的大模型是驴是马?还是得拉出来溜溜,通过应用来验证,风险比较大。
二、现有的“轮子”够用吗?
根据公开报道,目前有多家公司和研究机构正在开发和使用大规模模型。其中,OpenAI开发的大规模语言模型GPT-3是目前最著名的大模型之一。另外,谷歌、Facebook、微软等公司以及一些研究机构也在开发类似规模的模型。这些企业开发的大模型已经成为当前最流行的大模型:
-
GPT-3(Generative Pre-trained Transformer 3):GPT-3是由OpenAI开发的自然语言处理模型,具有1750亿个参数,可以生成高质量的文本。
-
BERT(Bidirectional Encoder Representations from Transformers):BERT是谷歌开发的自然语言处理模型,具有3.3亿个参数,可以用于文本分类、命名实体识别等任务。
-
T5(Text-to-Text Transfer Transformer):T5是谷歌开发的多任务自然语言处理模型,具有11亿个参数,可以用于多种文本相关任务,如机器翻译、文本摘要等。
-
BigGAN(Big Generative Adversarial Networks):BigGAN是由OpenAI开发的图像生成模型,具有7.5亿个参数,可以生成高分辨率、逼真的图像。
-
GPT-2(Generative Pre-trained Transformer 2):GPT-2是由OpenAI开发的自然语言处理模型,具有1.5亿个参数,可以生成高质量的文本。
这些大模型在各自领域内具有重要的影响力,广泛应用于自然语言处理、图像生成等任务中。
而且这些大模型大多数是开源的。开源大模型的出现对于科研社区和开发者来说是一个重大的进步,它们可以更轻松地使用和扩展这些模型,从而加速研究和开发的进程。开源大模型的开放性也促进了模型的迭代和改进,使得整个社区能够共同参与到模型的发展和优化过程中。
三、用好现有“轮子” 深耕场景应用
基于大模型的AI技术已经应用到许多实际场景中,并且都可以发挥最大作用,包括但不限于以下方面:
-
医疗诊断:AI可以通过分析医疗图像、病历和病人数据来帮助医生进行准确的诊断。它可以在早期发现疾病,辅助医生制定治疗计划,并提供个性化的医疗建议。
-
智能交通:AI可以用于交通管理、智能驾驶和交通预测。例如,AI可以减少交通拥堵,优化交通信号灯,提供实时导航和预测交通状况。
-
自然语言处理:AI可以用于机器翻译、语音识别和智能客服等领域。它可以帮助人们用自然语言与计算机交互,并实现自动化的语言处理任务。
-
金融风控:AI可以通过分析大数据和模式识别来预测金融风险,并提供个性化的投资建议。它可以识别异常交易和欺诈行为,并加强金融安全。
-
零售和电子商务:AI可以通过个性化推荐、购物助手和虚拟试衣间来提供更好的购物体验。它可以预测消费者需求,优化库存管理,并提供个性化的营销活动。
-
工业自动化:AI可以用于机器人控制、自动化生产线和故障诊断。它可以提高生产效率,降低成本,并减少人工错误。
-
智能家居:AI可以通过语音助手和智能设备来实现智能家居控制。它可以根据用户的习惯和偏好来自动调节温度、照明和安全系统。
这些只是一些示例,实际上,AI技术在许多领域都有广泛的应用,并且随着技术的不断发展,其应用场景还将不断增加。
开源大模型在企业中有许多应用。
首先,开源大模型可以用于自然语言处理任务,如文本分类、命名实体识别和情感分析等。企业可以使用开源大模型来构建自己的文本处理系统,以处理大量的文本数据,例如社交媒体评论、用户反馈等。
其次,开源大模型可以用于图像识别和计算机视觉任务。企业可以使用开源大模型来识别和分类图像,进行图像分割和目标检测等任务。这对于一些需要处理大量图像数据的企业,如电子商务、自动驾驶和安防等行业来说,是非常有价值的。
另外,开源大模型还可以用于语音识别和语音合成等语音处理任务。企业可以使用开源大模型来构建自己的语音识别系统,以识别用户的语音命令或进行语音交互。同样,语音合成也可以用于企业的自动客服系统或其他语音应用中。
最后,开源大模型还可以用于推荐系统和个性化推荐。企业可以使用开源大模型来分析用户的历史行为数据,并根据用户的兴趣和偏好,为其推荐相关的产品或内容。这对于电商、媒体和社交等企业来说,是非常重要的。
可见,现有的大模型已经被许多企业应用到了众多场景中,帮助企业处理和分析大量的文本、图像和语音数据,不仅提高工作效率和服务质量,而且为企业带来更多的商业价值。
综上所述,李彦宏说的“不要卷模型,要卷应用”还是值得我们认真考量的。