大模型只是轮子,与其闭门重复造轮子,不如深耕场景应用

如何理解李彦宏说的“不要卷模型,要卷应用”

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议全体会议在上海世博中心举办。在产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏呼吁:“大家不要卷模型,要卷应用!”李彦宏认为,AI技术已经从辨别式转向了生成式,但技术本身并不是目的,真正的价值在于如何将这些技术应用于实际场景,解决实际问题。并且提醒大家避免掉入“超级应用陷阱”,即过分追求用户日活跃量(DAU)而忽视了应用的实际效果和产业价值。称AI时代的规律可能不同于移动时代,一个“超级能干”的应用即使DAU不高,只要能为产业带来实质性的增益,其价值就远超传统的移动互联网。

一、“轮子”造价不斐

大模型的开发成本是一个相对较高的数字,具体的数值会受到多种因素的影响。可能影响大模型开发成本的因素包括但不限于以下方面:

  1. 数据收集和准备:为了训练大模型,通常需要大量的数据。收集、清洗和准备数据可能需要耗费大量的时间和人力资源。

  2. 硬件和基础设施:大模型通常需要更强大的计算资源和存储空间。如果没有合适的硬件基础设施,可能需要购买或租赁适当的服务器、GPU 或云计算实例。

  3. 研发团队:大模型的开发通常需要一个有经验的团队,其中包括数据科学家、工程师和研究人员等。团队成员的数量和专业水平将直接影响开发成本。

  4. 算法和模型设计:大模型的开发可能需要独特的算法和模型设计,这可能需要额外的研究和试验,也会增加开发成本。

  5. 训练和调试时间:训练一个大模型可能需要很长的时间,特别是在没有足够的计算资源时。同时,为了使模型达到最佳性能,可能需要花费大量的时间进行调试和优化。

综上所述,大模型的开发成本很难给出一个具体的数字,因为它受到众多因素的影响。但是通常来说,大模型的开发成本往往会比较高。

投入高成本打造的大模型是驴是马?还是得拉出来溜溜,通过应用来验证,风险比较大。

二、现有的“轮子”够用吗?

根据公开报道,目前有多家公司和研究机构正在开发和使用大规模模型。其中,OpenAI开发的大规模语言模型GPT-3是目前最著名的大模型之一。另外,谷歌、Facebook、微软等公司以及一些研究机构也在开发类似规模的模型。这些企业开发的大模型已经成为当前最流行的大模型:

  1. GPT-3(Generative Pre-trained Transformer 3):GPT-3是由OpenAI开发的自然语言处理模型,具有1750亿个参数,可以生成高质量的文本。

  2. BERT(Bidirectional Encoder Representations from Transformers):BERT是谷歌开发的自然语言处理模型,具有3.3亿个参数,可以用于文本分类、命名实体识别等任务。

  3. T5(Text-to-Text Transfer Transformer):T5是谷歌开发的多任务自然语言处理模型,具有11亿个参数,可以用于多种文本相关任务,如机器翻译、文本摘要等。

  4. BigGAN(Big Generative Adversarial Networks):BigGAN是由OpenAI开发的图像生成模型,具有7.5亿个参数,可以生成高分辨率、逼真的图像。

  5. GPT-2(Generative Pre-trained Transformer 2):GPT-2是由OpenAI开发的自然语言处理模型,具有1.5亿个参数,可以生成高质量的文本。

这些大模型在各自领域内具有重要的影响力,广泛应用于自然语言处理、图像生成等任务中。

而且这些大模型大多数是开源的。开源大模型的出现对于科研社区和开发者来说是一个重大的进步,它们可以更轻松地使用和扩展这些模型,从而加速研究和开发的进程。开源大模型的开放性也促进了模型的迭代和改进,使得整个社区能够共同参与到模型的发展和优化过程中。

 三、用好现有“轮子” 深耕场景应用

基于大模型的AI技术已经应用到许多实际场景中,并且都可以发挥最大作用,包括但不限于以下方面:

  1. 医疗诊断:AI可以通过分析医疗图像、病历和病人数据来帮助医生进行准确的诊断。它可以在早期发现疾病,辅助医生制定治疗计划,并提供个性化的医疗建议。

  2. 智能交通:AI可以用于交通管理、智能驾驶和交通预测。例如,AI可以减少交通拥堵,优化交通信号灯,提供实时导航和预测交通状况。

  3. 自然语言处理:AI可以用于机器翻译、语音识别和智能客服等领域。它可以帮助人们用自然语言与计算机交互,并实现自动化的语言处理任务。

  4. 金融风控:AI可以通过分析大数据和模式识别来预测金融风险,并提供个性化的投资建议。它可以识别异常交易和欺诈行为,并加强金融安全。

  5. 零售和电子商务:AI可以通过个性化推荐、购物助手和虚拟试衣间来提供更好的购物体验。它可以预测消费者需求,优化库存管理,并提供个性化的营销活动。

  6. 工业自动化:AI可以用于机器人控制、自动化生产线和故障诊断。它可以提高生产效率,降低成本,并减少人工错误。

  7. 智能家居:AI可以通过语音助手和智能设备来实现智能家居控制。它可以根据用户的习惯和偏好来自动调节温度、照明和安全系统。

这些只是一些示例,实际上,AI技术在许多领域都有广泛的应用,并且随着技术的不断发展,其应用场景还将不断增加。

开源大模型在企业中有许多应用。

首先,开源大模型可以用于自然语言处理任务,如文本分类、命名实体识别和情感分析等。企业可以使用开源大模型来构建自己的文本处理系统,以处理大量的文本数据,例如社交媒体评论、用户反馈等。

其次,开源大模型可以用于图像识别和计算机视觉任务。企业可以使用开源大模型来识别和分类图像,进行图像分割和目标检测等任务。这对于一些需要处理大量图像数据的企业,如电子商务、自动驾驶和安防等行业来说,是非常有价值的。

另外,开源大模型还可以用于语音识别和语音合成等语音处理任务。企业可以使用开源大模型来构建自己的语音识别系统,以识别用户的语音命令或进行语音交互。同样,语音合成也可以用于企业的自动客服系统或其他语音应用中。

最后,开源大模型还可以用于推荐系统和个性化推荐。企业可以使用开源大模型来分析用户的历史行为数据,并根据用户的兴趣和偏好,为其推荐相关的产品或内容。这对于电商、媒体和社交等企业来说,是非常重要的。

可见,现有的大模型已经被许多企业应用到了众多场景中,帮助企业处理和分析大量的文本、图像和语音数据,不仅提高工作效率和服务质量,而且为企业带来更多的商业价值。

综上所述,李彦宏说的“不要卷模型,要卷应用”还是值得我们认真考量的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/380185.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaWeb JavaScript ① JS简介

目录 一、HTML&CSS&JavaScript的作用 二、前后端关联标签——表单标签 1.form标签 2.input标签 3.get/post提交的差异 4.表单项标签 5.布局相关标签 块元素——div 行内元素——span 三、CSS 1.CSS引入方式 方式1 行内式 方式2 内嵌式 方式3 外部样式表 2.CSS选择器 元…

第三届智能机械与人机交互技术学术会议(IHCIT 2024)

【北航主办丨本届SPIE独立出版丨已确认ISSN号】 第三届智能机械与人机交互技术学术会议(IHCIT 2024) 2024 3rd International Conference on Intelligent Mechanical and Human-Computer Interaction Technology 2024年7月27日----中国杭州&#xff0…

Artix7系列FPGA实现SDI视频编解码,基于GTP高速接口,提供3套工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐本博已有的 SDI 编解码方案本方案在Xilinx--Kintex系列FPGA上的应用本方案在Xilinx--Zynq系列FPGA上的应用 3、详细设计方案设计原理框图SDI 输入设备Gv8601a 均衡器GTP 高速接口-->解串与串化SMPTE SD/HD/3G SDI IP核BT1120转…

Python+Flask+MySQL/Sqlite的个人博客系统(前台+后端管理)【附源码,运行简单】

PythonFlaskMySQL/Sqlite的个人博客系统(前台后端管理)【附源码,运行简单】 总览 1、《个人博客系统》1.1 方案设计说明书设计目标工具列表 2、详细设计2.1 管理员登录2.2 程序主页面2.3 笔记新增界面2.4 文章新增界面2.5 文章/笔记管理界面2…

实战:Eureka的概念作用以及用法详解

概叙 什么是Eureka? Netflix Eureka 是一款由 Netflix 开源的基于 REST 服务的注册中心,用于提供服务发现功能。Spring Cloud Eureka 是 Spring Cloud Netflix 微服务套件的一部分,基于 Netflix Eureka 进行了二次封装,主要负责…

C/C++ json库

文章目录 一、介绍1.1 json 介绍 二、C/C json 库选型2.1 选型范围2.2 jsoncpp2.2.2 jsoncpp 编译和交叉编译 2.3 rapidjson2.4 nlohmann/json2.5 sonic-cpp 五、常见问题5.1 jsoncpp 中关于浮点数的控制和中文显示问题5.2 jsoncpp序列化double类型时精度损失问题的解决办法 一…

docker 部署wechatbot-webhook 并获取接口实现微信群图片自动保存到chevereto图库等

功能如图: docker部署 version: "3" services:excalidraw:image: dannicool/docker-wechatbot-webhook:latestcontainer_name: wechatbot-webhookdeploy:resources:limits:cpus: 0.15memory: 500Mreservations:cpus: 0.05memory: 80Mrestart: alwayspor…

「实战应用」如何用DHTMLX将上下文菜单集成到JavaScript甘特图中(三)

DHTMLX Gantt是用于跨浏览器和跨平台应用程序的功能齐全的Gantt图表。可满足项目管理应用程序的所有需求,是最完善的甘特图图表库。 DHTMLX Gantt是一个高度可定制的工具,可以与项目管理应用程序所需的其他功能相补充。在本文中您将学习如何使用自定义上…

React、Vue的password输入框组件,如何关闭自动填充?

有时候我们的表单使用了一个password组件,这时候每次打开新建,都会自动获取浏览器缓存的密码,但是它的上一个input输入框并不是用户名,这时候我们希望我们的表单,每次点开的时候密码是空的,让用户自动输入&…

iMazing 3 换手机后苹果游戏数据还有吗 换iPhone怎么转移游戏数据

当你想要更换手机,无论是选择升级到最新款iPhone,或者换到“经典”旧款iPhone,单机游戏数据的转移总是让人发愁。本文将详细介绍换手机后苹果游戏数据还有吗,以及换iPhone怎么转移游戏数据,确保你能无缝继续你的游戏体…

【体外诊断】ARM/X86+FPGA嵌入式计算机在免疫分析设备中的应用

体外诊断 信迈提供基于Intel平台、AMD平台、NXP平台的核心板、2.5寸主板、Mini-ITX主板、4寸主板、PICO-ITX主板,以及嵌入式准系统等计算机硬件。产品支持GAHDMI等独立双显,提供丰富串口、USB、GPIO、PCIe扩展接口等I/O接口,扩展性强&#xf…

源码搭建国内微短剧系统(小程序+APP)短剧配置抖音教程

短剧不知道如何配置抖音小程序?翻阅很多资料帮大家整理了一份非常详细的操作文档,给大家介绍源码搭建的短剧系统是如何一步一步配置抖音小程序的。 顺便推荐一下他们的开源地址:https://gitee.com/nymaite_com_2878868888/tjguonei 文档说明…

# Redis 入门到精通(八)-- 服务器配置-redis.conf配置与高级数据类型

Redis 入门到精通(八)-- 服务器配置-redis.conf配置与高级数据类型 一、redis 服务器配置–redis.conf 配置 1、服务器端设定 1)设置服务器以守护进程的方式运行: daemonize yes|no 2)绑定主机地址: bin…

NVIDIA全面转向开源GPU内核模块

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

199.二叉树的右视图(DFS)

给定一个二叉树的根节点 root,想象自己站在它的右侧,按照从顶部到底部的顺序,返回从右侧所能看到的节点值。 示例 1: 输入: [1,2,3,null,5,null,4] 输出: [1,3,4] 示例 2: 输入: [1,null,3] 输出: [1,3] 示例 3: 输入: [] 输出: [] 解题…

“生日悖论”简析——公式计算、代码模拟

“生日悖论”共享生日概率,通项公式计算,代码模拟计算。 (笔记模板由python脚本于2024年07月17日 18:16:40创建,本篇笔记适合会基础编程的coder翻阅) 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free&…

ranger审计日志对接CDH solr

作者:耀灵 一、准备条件 1、已安装完毕ranger-admin 2、已在CDH上部署solr(注意在安装solr时更改下solr在zk上的节点信息) 二、更改相关配置 1、修改ranger-2.1.0-admin/contrib/solr_for_audit_setup/install.properties SOLR_USERsolr …

FreeRTOS的中断管理、临界资源保护、任务调度

什么是中断? 简介:让CPU打断正常运行的程序,转而去处理紧急的事件(程序),就叫中断。 中断优先级分组设置 ARM Cortex-M 使用了 8 位宽的寄存器来配置中断的优先等级,这个寄存器就是中断优先级…

使用 OpenCV 和 YOLO 模型进行实时目标检测并在视频流中显示检测结果

文章目录 Github官网简介视频帧推理视频设备ID安装依赖 检测示例分类示例姿势估计 Github https://github.com/ultralytics/ultralytics 官网 https://docs.ultralytics.com/zhhttps://docs.ultralytics.com/zh/quickstart/ 简介 Ultralytics 是一个软件公司,专…

基于 CNN(二维卷积Conv2D)+LSTM 实现股票多变量时间序列预测(PyTorch版)

前言 系列专栏:【深度学习:算法项目实战】✨︎ 涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域,讨论了各种复杂的深度神经网络思想,如卷积神经网络、循环神经网络、生成对…