大模型时代的AI应用开发,可以不用,但必须会

成熟的“格子衫”和年轻的“脸庞”,与开发者有关的大会总是少不了这两种元素,Create 2024百度AI开发者大会也不例外。

过去几十年,层出不穷的编程语言、框架等新技术,把一代又一代年轻的脸庞,塑造为成熟的格子衫,软件应用开发的效率确实在提升,但却总是跟不上庞大而又繁杂的需求,似乎开发者将永远陷入在这样的循环。

直到大模型的出现。

“你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”百度创始人、董事长兼首席执行官李彦宏言之凿凿。

掷地有声。成熟的格子衫还在思考,话语有几分可信与其间难题,年轻的脸庞已经深信不疑,迫切想要听到该如何“说话”,才能成为新时代的开发者。

基础大模型的确炫人眼目,大部分人如今还沉浸在基础模型层面,但是时候把更多目光聚焦在应用层面,先是大模型等新技术为应用场景提供了新的可能性,接下来就是软件应用生态的繁荣,去推大模型的再次提升。

而百度正在做的事,就是扫平大模型和应用之间的障碍,这也是本次开发者大会,百度拿出的三大工具——智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。

大模型,应用为王

“大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。”李彦宏表示。

正如李彦宏所言,过去一年,大模型足够让人侧目,例如百度文心大模型,从3.0版本到3.5,再到4.0版本的进化,在代码生成、代码解释、代码优化等通用能力方面,达到国际领先水平。

文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。

但仅靠大模型还不足以催生出新的业态,就像互联网起初只是一种技术概念,而互联网应用融入到千行百业的场景,造就了如今耳熟能详的互联网巨头。“他们”没有发明互联网技术,也没有在互联网的底层基础设施做文章,却是把互联网用得最好的代表。

百度为开发者提供的大模型,就像是过去的互联网,百度有动力也有必要,提供尽可能好的大模型,从而为大模型应用开发者打好基础。

可以想象,百度冲在大模型第一线,踩坑是免不了的。李彦宏也直言,百度“踩了无数的坑,交了高昂的学费”,得出了一些基于大模型开发AI原生应用的具体思路和工具,直接分享给行业。

第一是MoE。未来大型的AI原生应用基本都是MoE架构,这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,要针对应用的不同场景做匹配。

第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调后的小模型,其使用效果可以媲美大模型。

“这就是我们发布Speed,Lite、Tiny三个轻量模型的原因。我们通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。”李彦宏说。

第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。

智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,还可以让不同的智能体互动,相互协作,更高质量地完成任务。这些智能体能力,反思、规划、自我计划的能力,百度已经开发并向开发者全面开放。

AI应用开发三大“神器”

李彦宏表示,大模型和生成式AI,将彻底改变开发者群体。过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言。

与之相对应地,开发者的武器库也需要与时俱进,以适应新时代的软件开发体系,同时针对MoE、小模型、智能体这三大方向上,百度已经做好了“开箱即用”的工具。

AgentBuilder:最主流的大模型使用方式

首先是智能体开发工具AgentBuilder。智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。

以新加坡旅游局为例,打开文心智能体平台,创建页面有着零代码、低代码两种模式,新手可以直接选择“零代码模式”,用自然语言,几句话就能创建一个智能体,实现酒店查询、景点门票购买等服务能力,目前百度已经跟携程合作,提供了酒店、景点、票务等旅游服务工具。

新加坡之外,大连、沈阳等文旅类智能体也都在文心智能体平台上线,还有知识类、创作类、学习类、娱乐类等各式各样的智能体。

目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。文心智能体平台还为开发者们提供了流量变现的通路。除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力,为开发者解决流量分发的后顾之忧,获得实打实的收益。

有分发,就会有数据反馈;有数据反馈,飞轮转起来,智能体就能够自主迭代,越用越聪明。文心智能体平台还上线了智能体的数据分析和问答调优模块,不久后还将有更多的新能力上线。文心智能体平台将通过分发-诊断-收益的数据飞轮,驱动智能体形成质量更优、流量更好、收益更大的正循环。

除了新加坡之外,大连、沈阳等文旅类智能体也都在文心智能体平台上线,还有知识类、创作类、学习类、娱乐类等各式各样的智能体,这些都能在AgentBuilder做出来。

AppBuilder:自然语言三步就能开发一个应用

AppBuilder提前封装和预置了开发AI原生应用所需的各种组件和框架,可以大幅降低开发门槛,不写一行代码,最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。

以游乐场排队助手为例,打开AppBuilder的开发界面,第一步先给应用起名“游乐场排队助手”,第二步填写角色指令,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等;第三步再插入需要的工具组件。这样,在零代码的情况下,一个应用就生成了。

从去年开始,百度用AI重构了百度文库,使它成为用户“内容生产的起点”。如今,在AppBuilder的支持下,百度文库新推出的智能漫画和智能绘本,更是把场景延伸到了更加有趣的跨模态创作领域。

在AppBuilder上面,百度也提供了一定的跨模态能力,开发者只需要给一段文字,或者几句话,就可以快速创建绘画类的应用,像漫画、儿童绘本等。百度文库最新推出的漫画生成和绘本生成功能,就利用了AppBuilder上提供的这类组件。

从行业视角来看,百度AppBuilder具备两个明显优势:

一是功能强大。依托文心4.0对指令的理解和遵循能力,百度AppBuilder能保证冷启动状态下就能达到一个不错的水平,不会因为效果差,再花很长时间去调优,大大降低了开发门槛。

依托检索增强技术RAG,在知识问答等典型场景,问答准确率和友好回复程度都达到了95%以上,大幅超越其他同类产品。AppBuilder还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的AI能力组件、大模型能力组件,还有百度独家开放的业务组件等55个组件。

此外,一些主流场景的第三方API,比如航班查询、论文查询等,百度也有提供,最新支持了自定义组件,客户可以直接对接自己专有的任何工具和数据。这些丰富的组件,共同支撑起了AI原生应用的高效开发。

二是简单易用。使用AppBuilder,只需三步即可快速创建应用、一键分发。百度也支持开源的SDK,方便大家进行二次开发。

ModelBuilder:高效低价生产模型

ModelBuilder是更适合专业开发者使用的工具,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT,从而能达到更好的效果。

为了方便专业开发者快速上手,ModelBuilder预置了最全面最丰富的大模型。包括了ERNIE3.5和ERNIE4.0旗舰版大模型,它适合通用的复杂场景,能力强大;

此外还有三个轻量级的大模型,Speed、Lite、Tiny;以及两个垂直场景的模型——ERNIE Character适合角色扮演,ERNIE Functions适合对话或问答场景中的外部工具使用和业务函数调用。当然也包括国内外第三方主流模型,总数量达到77个,ModelBuilder是国内拥有大模型数量最多的开发平台。

以小度添添AI机器人日程规划为例,背后调用了不同的模型。先是由小模型ERNIE Tiny执行了“模型路由”的工作——把晨跑中的天气问题,分配给了基于ERNIE Lite打造的精调模型,快速查询出了气温25度、天气晴朗这些信息;同时,又把更复杂的日程安排,分配给了性能最好的大模型——文心4.0,来计算一天各项事项安排。

ModelBuilder的关键是高效低价生产模型的能力。企业客户可以根据需要,兼顾效果、响应速度、推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,并且支持精调和Post-pretrain。

通过降维裁剪出来的模型,比直接拿开源调出来的模型,同等尺寸下,效果明显更好,同等效果下,成本明显更低。

AI应用繁荣,大模型才能再进化

大模型到了聚合生态力量的新阶段,无论是国内还是国外,头部厂商都在试图打造新的大模型生态,AI应用的繁荣不仅能够证明大模型的价值,也能够反过来推动大模型的再进化。

当AI应用大量被创造,越来越多的数据被生成和收集,模型有更多的机会学习到不同场景下的应用知识;规模化带来专用硬件的普及和性能提升,使得训练和运行大模型变得更加可行和高效;多样化的应用场景带来正向商业收益,商业成功将转化为AI应用和大模型的资源。

百度文心大模型正在走上这一条路,用大模型和AI应用的相互促进,实现大模型生态的正向商业循环。

李彦宏表示,文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。百度在芯片、框架、模型、应用这四层架构上有着全栈的布局,通过端到端优化,不断地把成本打下来,让更多人都可以高效、低价地用大模型来做AI应用,通过端到端优化能力,不断提高文心大模型和文心一言的效率。

“实战是大模型最好的训练场,庞大的调用量将给予文心大模型更多反馈,反向促进了文心大模型的能力提升,形成飞轮效应,进一步扩大文心大模型和国内同行的差距。”他说。

文心一言从去年3月16日首发,在一年零一个月的时间里,用户数突破了2亿,每天API的调用量也突破了2亿,服务客户数或者说企业达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。

百度一并发布了文心大模型4.0的工具版,用户可以在工具版上体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供高效精准的支撑。

此外,创业者生态也是大模型的有生力量。去年5月份,百度启动了“文心杯”创业大赛,第一届“文心杯”创业大赛,收到了近1000支创业团队报名,百度为其中的15支优胜团队,提供了近亿元的投资支持,并且在技术、团队和资源上持续提供全方位扶持。

李彦宏在现场宣布,第二届“文心杯”创业大赛正式启动,本次将扩大项目筛选范围、设置分赛场,面向全球市场及高校学子,招募创业创新团队。

只要创业方向是AI原生应用,都可以在大赛官网报名参赛,同时百度也加大了对创业者的支持力度,提供更充足的投资资金、更丰富的业务资源,还首次设立了“特别大奖”,特别优秀的项目将有机会获得最高5000万人民币的现金和资源支持。

无论是成熟的“格子衫”,还是年轻的脸庞,都是中国大模型产业的一分子,百度通过AI应用开发三大“神器”,展示出了一幅通向大模型产业未来的道路。这条路,有百度,也有千千万万的开发者群体。

零基础如何学习大模型 AI

领取方式在文末

为什么要学习大模型?

学习大模型课程的重要性在于它能够极大地促进个人在人工智能领域的专业发展。大模型技术,如自然语言处理和图像识别,正在推动着人工智能的新发展阶段。通过学习大模型课程,可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术,从而提升自己在数据处理、分析和决策制定方面的能力。此外,大模型技术在多个行业中的应用日益增加,掌握这一技术将有助于提高就业竞争力,并为未来的创新创业提供坚实的基础。

大模型实际应用案例分享

①智能客服:某科技公司员工在学习了大模型课程后,成功开发了一套基于自然语言处理的大模型智能客服系统。该系统不仅提高了客户服务效率,还显著降低了人工成本。
②医疗影像分析:一位医学研究人员通过学习大模型课程,掌握了深度学习技术在医疗影像分析中的应用。他开发的算法能够准确识别肿瘤等病变,为医生提供了有力的诊断辅助。
③金融风险管理:一位金融分析师利用大模型课程中学到的知识,开发了一套信用评分模型。该模型帮助银行更准确地评估贷款申请者的信用风险,降低了不良贷款率。
④智能推荐系统:一位电商平台的工程师在学习大模型课程后,优化了平台的商品推荐算法。新算法提高了用户满意度和购买转化率,为公司带来了显著的增长。

这些案例表明,学习大模型课程不仅能够提升个人技能,还能为企业带来实际效益,推动行业创新发展。

学习资料领取

如果你对大模型感兴趣,可以看看我整合并且整理成了一份AI大模型资料包,需要的小伙伴文末免费领取哦,无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段
在这里插入图片描述

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,皆可用。
在这里插入图片描述

三、视频和书籍PDF合集

从入门到进阶这里都有,跟着老师学习事半功倍。
在这里插入图片描述

在这里插入图片描述

如果二维码失效,可以点击下方链接,一样的哦
【CSDN大礼包】最新AI大模型资源包,这里全都有!无偿分享!!!

😝朋友们如果有需要的话,可以V扫描下方二维码联系领取~
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/407817.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

技术前沿:WebRTC与H.265编码的兼容性挑战与应对策略

WebRTC(Web Real-Time Communication)是一种支持网页浏览器进行实时语音通话、视频聊天以及P2P文件共享的技术。然而,标准的WebRTC API在大多数浏览器中默认并不支持H.265(也称为HEVC,高效视频编码)编码。这…

3D打印的模具镶件性能究竟如何?

随着模具制造业的快速发展,3D打印技术凭借其独特优势,在模具随形水路设计、异形模具制造及模具排气结构优化等方面大放异彩,赢得了注塑、压铸等行业的广泛关注。然而,新技术带来的材料变革让不少人对3D打印模具的性能持观望态度—…

超全大模型训练流程,教你如何训练自己的大模型

“大模型的核心主要有两部分,一是训练数据,二是机器学习模型。” 现在大模型发展得如火如荼,但是没有学过人工智能技术的开发者,只会调用其接口,但不清楚怎么训练一个大模型。 今天就简单介绍一下自己的理解&#xf…

算法日记day 46(单调栈之下一个更大元素|柱状图中最大图形)

一、下一个更大元素1 题目: nums1 中数字 x 的 下一个更大元素 是指 x 在 nums2 中对应位置 右侧 的 第一个 比 x 大的元素。 给你两个 没有重复元素 的数组 nums1 和 nums2 ,下标从 0 开始计数,其中nums1 是 nums2 的子集。 对于每个 0 …

【C语言】进程和线程详解

目录 C语言进程和线程详解1. 进程和线程的对比2. 进程的基本概念2.1 进程的定义2.2 进程的特点2.3 进程的生命周期 3. 进程管理3.1 进程创建3.2 进程间通信(IPC)3.2.1 管道(Pipe) 4. 线程的基本概念4.1 线程的定义4.2 线程的特点 …

正则表达式匹配成对括号

匹配一对括号,用于在一个html文本中提取JSon 文本。例如 { “duration”:7599,"minBufferTime{second bracket }{third bracket} } 一对加粗的{} ,而不要中间的{}。简单写法会出现错误匹配。 在.Net Framework的正则表达式中,提供了”…

大数据-100 Spark 集群 Spark Streaming DStream转换 黑名单过滤的三种实现方式

喜大普奔!破百了! 点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完&a…

Java框架Shiro、漏洞工具利用、复现以及流量特征分析

Shiro流量分析 前言 博客主页: 靶场:Vulfocus 漏洞威胁分析平台 Shiro(Apache Shiro)是一个强大且灵活的开源安全框架,专为Java应用程序提供安全性解决方案。它由Apache基金会开发和维护,广泛应用于企业级…

毛利率承压连亏三年后一季度业绩暴增,百利天恒谋求A+H双上市

《港湾商业观察》施子夫 7月10日,四川百利天恒药业股份有限公司(以下简称,百利天恒)递表港交所主板,联席保荐机构高盛、摩根大通和中信证券。 此次递表港交所系百利天恒第二次谋求上市,若上市成功&#x…

PyTorch升级之旅——安装与基本知识

目录 一、安装 二、张量 创建tensor 张量的操作 广播机制 三、自动求导 四、并行计算 (一)网络结构分布到不同的设备中(Network partitioning) (二)同一层的任务分布到不同数据中(Layer-wise partitioning) (…

GoModule

GOPATH 最早的就是GOPATH构建模式, go get下载的包都在path中的src目录下 src目录是源代码存放目录。 package mainimport ("net/http""github.com/gorilla/mux" )func main() {r : mux.NewRouter()r.HandleFunc("/hello", func(w h…

解决使用matplotlib不显示中文的问题

某季度某城市某天11点到12点气温变化图 import random x range(60) y_BeiJing [random.uniform(15,18) for i in x] plt.figure(figsize(20,8),dpi80) plt.plot(x,y_BeiJing) x_label ["11点{}分".format(i) for i in x] plt.xticks(x[::5],x_label[::5]) plt.yt…

【精选】基于微信小程序的地铁站点查询系统(全网独一无二,阿龙原创设计)

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…

C# x Unity面向对象补全计划 设计模式 之 实现一个简单的有限状态机

一个简单的有限状态机可以有如下内容 1.状态基类(定义基本状态的方法,如进入(Enter)、执行(Execute)和退出(Exit),同时可以在此声明需要被管理的对象) 2.具体…

【精选】基于python的影片数据爬取与数据分析

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…

软件设计师教程(第5版)第5章 软件工程基础知识(更新中)

5.1 软件工程概述 【软件工程】是指应用计算机科学、数学及管理科学等原理,以工程化的原则和方法来解决软件问题的工程,其目的是提高软件生产率、提高软件质量、降低软件成本。P239 5.1.1 计算机软件 计算机软件是指计算机系统中的【程序】及其【文档】。P240 【…

一文解决---IDEA汉化问题(含中英文切换)

一、英文->中文: ①.下载汉化包插件: 操作顺序:File->Settings->Plugins 在搜索框输入Chinese,然后找到 Chinese (Simplified) Language (汉化插件),等待下载完→Install (安装)&…

OpenCV几何图像变换(9)仿射变换函数warpAffine()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 函数是应用一个仿射变换到图像上。 warpAffine 函数使用指定的矩阵对源图像进行仿射变换: dst ( x , y ) src ( M 11 x M 12 y M…

《机器学习》 决策树剪枝、树模型参数及案例演示

目录 一、决策树剪枝 1、什么是决策树剪枝? 2、如何剪枝 3、剪枝剪哪个位置的叶子结点 二、树模型参数及用法 1、参数种类 2、参数解释 1)criterion:gini or entropy 2)splitter:best or random 3&#xff0…

从心理学的角度,探究一下人类为什么爱玩游戏。(缓解压力、社交需求、 获得成就感)

文章目录 引言I 游戏中的美学和文化元素,是影响玩家心理状态的关键因素。音乐美工文化背景II 成年人对游戏的心理需求获得成就感社交需求缓解压力III 心流理论(Flow Theory)解释玩家虽受虐,但也其乐无穷的现象知识扩展: 心流知识扩展: 心流活动知识扩展:得性乐观(Learne…