解密大模型与文心一言

3147c797b73d6f162d9b32382beb0454.gif

近日,百度集团副总裁袁佛玉受邀出席数字纵深论坛并进行“解密大模型与文心一言“主题分享。

数字纵深论坛由北京大学光华管理学院数字教育中心主办,专注于分享科技前沿与商业洞见。

以下为分享精华回顾:

大家都能感受到,ChatGPT和百度文心一言这样的大模型非常火。今天我们就聊一聊,它爆火背后到底是什么原因?接下来还会发生什么?我们每个人、每家企业如何参与其中?

这个现象的发生,有一部分是在大家的设想之中,也有一部分在大家意料之外。甚至说,由于技术的快速发展,即使是身在其中的企业,对它的认知也在不断迭代中。很多新生事物的发展,有很大的不确定性,我们往往对它的发展方向有个大致的判断,然后需要在实践中探索获得积极反馈,才能不断地往前走,这就是“反馈驱动创新”的理念

我们也希望跟大家一起,在新一波人工智能产业化浪潮中,共同去推动一些创新,推动人工智能技术的落地。

接下来,我重点讲一下大模型。这是当下最热、最前沿的人工智能发展方向。

ChatGPT爆火,AGI曙光初现

有媒体报道说:没有任何一次产业方向,行业这么快地达成共识。全球所有的大公司,都在往同一个方向去做——预训练大模型。

我们定义当下是人工智能发展的“拐点”,而不是“终点”。不是说,ChatGPT或者文心一言就是最终形态;而是说,它是人工智能发展到这个阶段产生的一个现象级产品。接下来,还会有非常多现象级的产品出现,还会有更多的突破发生。

b8e5d095e662cecfd8fa5f915a1a898e.png

这种基础设施级、操作系统级的创新,又意味着什么?让我们先回看一下历史——上面这张图,左边是中国过去40年GDP的增长曲线图;右边是过去2000年世界人均GDP的增长曲线图。我们可以看到,在人类发展历史中,有很长一段时间,人均GDP是不怎么增长的。但在最近的大约250年,GDP有了高速的、指数级的增长。这个增长就是人类历史上的三次科技革命带来的,是创新驱动增长,科技创新驱动了大的增长。

所以,对于当下我们所经历的现象,本质上是我们正在经历第四次工业革命。人工智能是第四次工业革命的核心驱动力量,标志性技术就是深度学习算法。这项技术能够驱动的经济增长,会比很多人想象得更大。当下大家看到的是一些热门的应用方向,但是接下来,它会重塑整个经济、社会、产业和人们生活的方方面面。

大模型智能涌现,人工智能迎来拐点

e94b4dade96f0f30b94e7bfc8bf12fba.png

那为什么是今天?为什么是现在?

其实人工智能已经跌宕起伏,火了几十年。它有过很多次被社会层面认知,受追捧,然后又冷却,又重新再受追捧。大家应该都记得,当年Google的AlphaGo在围棋上打败李世石,就引发了巨大的关注。

那么, 当下这波人工智能大浪潮有什么不同?我们知道,人工智能有三要素:算力、算法、数据。今天,这三个要素的齐头并进,让人工智能技术产生了本质性的改变,来到了一个临界点。

算法上的突破是最显著的,大模型背后核心技术就是深度学习算法。数据上看,2020-2025 年,全球数据平均增速预计达到23%。而且数据是越用越多,大量企业的数字化,还会不断产生更多的数据。在算力方面,2006年-2020年,芯片计算性能提升了600多倍,未来可能还会有更大的突破。今天大家还在讨论算力卡脖子,我们认为,到一定阶段算力也许都不是问题。

算力、算法、数据三方面共同的狂飙突进,成就了今天人工智能的拐点来临。

18430fc2b573e129ec8b4e6d0c821ed2.png

大模型带来了更高的生产效率:一是更少的训练数据。预训练开发模式可以把训练数据量减少90%;二是更少的算力投入,通过端到端训练和微调,算力投入可以减少90%;三是更短的开发周期。模型开发时间可以下降85%,从1周缩短到1天。

文心大模型

人工智能时代,应用会基于大模型来进行开发。

百度的文心大模型,是由百度智能云的AI大底座训练出来的。同时,AI大底座又包含了文心大模型的能力,并服务千行百业。

百度智能云的AI大底座,是全栈自研的,是一个全要素、端到端的AI基础设施,包括了推理芯片昆仑芯、基于产业实践的深度学习框架飞桨、文心大模型,还有上层的产业应用。

在这四层架构上,都能做端到端的优化,性能和效果、效率就能达到极致。比如说,千卡的加速比可以提升90%,资源的利用率可以提升70%,开发效率可以提升100%。

当我们讲百度文心大模型,我们要强调的是,它是产业级的知识增强大模型。

“产业级”,指的是我们的文心大模型是来自产业,应用于产业的大模型。它是在产业实际应用中真正产生价值的一个模型,这是我们非常有特色的一个地方。业界一些大模型,其实是既没有应用场景,也没有真正的用户和客户。

“知识增强”,指的是我们的文心大模型,它不仅从无监督的语料中学习知识,还通过百度多年积累的海量知识中学习。这些知识,是高质量的训练语料,有一些是人工精标的,有一些是自动生成的。比如搜索和点击数据,信息流上打的标签,这些都是经过大量的规则和模型训练优化过的数据。再比如,我们有全世界最大的中文知识图谱数据,有5500亿事实,这些都可以作为大模型的输入。文心大模型参数量非常大,达到了2600亿。

全球性AI再造拉开序幕

云计算游戏规则根本性改变

c2bf974d0c5b6ad61b53b97c7924e4db.png

大模型浪潮,带来了全球性的AI再造。那它的本质是什么呢?是生产经营效率和用户体验效率的“双效”提升,这将加速社会的 “智能化跃迁”。

一个是从供给端来看,生产经营的效率将会得到极大提升。大模型和生成式AI已经可以帮我们写代码、写合同、写PPT。而接下来,多模融合的生成式AI,则会更深入地重塑我们生产的全流程。

另一个是从需求端来看,用户体验的效果将会得到极大提升。基于生成式AI的各种数字人,或者叫做个性化助理,会帮助我们解决健康、理财、法律等一系列问题;人和机器的交互界面也会更加自然、友好。除了生成文字之外,未来通过plug-in,就是接口的方式,你跟它讲讲话,它就可以上携程,帮你把酒店机票都订完了。对用户来讲,这个体验变得非常好,不用在各种APP之间跳转。

人工智能可以把所有的行业再造一遍。过去拥有优势的企业,可用它来巩固自己的优势。过去优势不很明显的企业,则有机会在新的阶段,用它来建立自己独特的竞争优势。

数以千计的创业公司,也正在用生成式AI来改造千行百业。全球性的AI再造已经势不可挡。每个企业需要重新思考,自己的优势是什么、如何用AI来放大这个优势。

文心一言大语言模型,会带来哪些创业机会、投资机会?我们认为,至少有三方面的机会。

一是新型云计算公司。我们认为,它适合少数大型科技公司,因为它需要大量的技术创新和突破+大量的人才+超大规模的数据+超大规模的算力,然后才能打磨出大语言模型,成本非常高。也没有必要每个公司都去搞一个大语言模型。大模型做得好的公司,它就会成为下一代的云计算领导者。

二是行业模型精调,是中间层,适合一些高科技创业公司,它可以基于通用大模型做一些有创造性的工作。除此之外,还有大型的集团型企业、集团中心、产业园区,也可以作为中间层的玩家。这几类公司,可以构建它所在行业的行业大模型,然后形成行业的数据闭环,根据业务需求对大模型进行精调,激发出大模型在行业里面的特定能力。

三是应用开发。这对所有的企业来说都有机会。那么这一层需要的核心能力是什么呢?是能够充分理解什么是大模型,然后对大模型充分利用,同时也对自己所在的场景,有产品能力和创新能力。

我们认为模型即服务,就是MaaS,它将撬动万亿级的市场。

中国的产业链非常丰富,我们本土产业会产生很多真实的场景和数据,这会反过来推动我们自己的大语言模型,不断地迭代和优化,最后会产生更大的价值,我们对此非常有信心。

在人工智能时代,我相信一定会出现杀手级的应用、现象级的新的产品,大家会不断地看到一个一个里程碑事件的发生。基于大语言模型的超级应用,未来创造的价值可能是移动互联网的10倍。

*本文由北大光华数字教育中心依据百度集团副总裁袁佛玉现场分享整理

bf5ab85f562e0aff6c22d2cea0218f12.png

356650fc5754cedb8abe8ff6c063d1d0.png

d943a1a04d1316028c499be98bc5b941.jpeg

b4ff3fbe420c9470943dd0005aa886b7.jpeg

6da5dba48442e2218d311c0159e0d189.jpeg

点击“阅读原文”,立即合作咨询

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/73076.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能Python-python3_7如何下载

Python3.7如何下载?详细步骤分享! Python是一门当今最热门、最常用、最易学的编程语言之一,且拥有庞大的社区和强大的库支持。在这篇文章中,我们将会详细介绍如何下载Python3.7版本,让大家能够轻松上手Python编程。 …

【历史上的今天】7 月 19 日:IMAP 协议之父出生;Project Kotlin 公开亮相;CT 成像实现新突破

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 7 月 19 日,在 2010 年的今天,亚马逊发布了一份新闻稿,提到它现在销售的 Kindle 书籍比精装书还多。亚马逊公司旗下 Lab126…

摆平Win2008与VPC2007的诡异冲突

摆平 Win2008 与 VPC2007 的冲突 话说上个周末,参加完51CTO组织的虚拟化技术沙龙,俺和老方,老胡,小废物等人杀奔西直门的红顶老汉烧鸡公,席间觥筹交错,一顿狂磋。说句题外话,这个鸡的味道真是不…

NeurIPS 2020 | 基于协同集成与分发的协同显著性目标检测网络

论文题目:CoADNet: Collaborative Aggregation-and-Distribution Networks for Co-Salient Object Detection 论文链接:https://proceedings.neurips.cc/paper/2020/file/4dc3ed26a29c9c3df3ec373524377a5b-Paper.pdf 论文代码:https://githu…

别再对 Istio 一脸懵了,万众期待的第一本 Istio 著作现!已!上!市

过去一年里,Service Mesh作为新兴的微服务架构,在国内大热。其被誉为是下一代微服务,是云原生技术栈的关键组件之一。而Istio作为第2代Service Mesh的头牌, 在 GitHub 上疯狂收获近 15000 颗星,成为 2018 年最热门的项…

每周送新书:Android软件安全、深入浅出Istio、软件架构设计

每周送新书:Android软件安全、深入浅出Istio、软件架构设计 本栏目每周会给大家推荐三个不同领域的新书,每周关注,总有适合你的好书。 每周送新书活动规则: 在文末评论里回复你对本周推荐图书或相关技术的看法,再或者…

(附源码)基于spring boot 青少年公共卫生教育平台的设计与实现 毕业设计 643214

Springboot青少年公共卫生教育平台 摘 要 信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对青少年公…

IT服务管理的指挥与智慧

IT服务管理的指挥与智慧 在当今动荡不宁、不断变化的 IT 环境中,IT服务管理(ITSM)的重要性不言而喻,它通过保证关键业务系统和服务的可用性和可靠性,为整个企业提供至关重要的支持。随着技术变得越来越复杂&#xff0c…

php比特教务选排课系统的设计与实现毕业设计源码301826

比特教务选排课系统的设计与实现 摘 要 随着人类向信息社会的不断迈进,风起云涌的信息时代正掀起一次新的革命,同时计算机网络技术高速发展,网络管理运用也变得越来越广泛。因此,建立一个B/S结构的比特教务选排课系统来管理选课信…

Springboot爱护大自然的设计与实现 毕业设计-附源码231643

爱护大自然 摘 要 热爱大自然,保护自然环境,是人们处理与自然关系过程中应当遵守的基本行为准则。第一,热爱大自然,是人类社会赖以生存和发展的物质条件。自然界一切对人类社会生活有益的存在物,如山川草木、飞禽走兽、…

python面向对象案例步骤分析_Python面向对象之继承原理与用法案例分析

本文实例讲述了Python面向对象之继承原理与用法。分享给大家供大家参考,具体如下: 目标 单继承 多继承 面向对象三大特性 封装 根据 职责 将 属性 和 方法 封装 到一个抽象的 类 中 继承 实现代码的重用,相同的代码不需要重复的编写 多态 不同…

中国多媒体与网络教学学报杂志中国多媒体与网络教学学报杂志社中国多媒体与网络教学学报编辑部2022年第6期目录

中国多媒体与网络教学学报杂志中国多媒体与网络教学学报杂志社中国多媒体与网络教学学报编辑部2022年第6期目录 实践研究_案例精选 找春天 左文慧; 1-515 长方体和正方体的认识 史颂; 6-912 测定空气中氧气的含量 彭洪;肖启友; 10-12 基于单元要素 设计智趣活动…

ServiceComb WorkShop 回顾与干货

ServiceComb开源项目 在 北京国家会议中心 LC3(LinuxCon ContainerCon CloudOpen) 大会上如期首发,展台火热,WorkShop交流氛围活跃,被迫延长30分钟结束,那么让我们在这个高规格大会尾声之际好好回顾一把。…

【合集】SAP 成都研究院开发工程师们精彩纷呈的工作和生活片段

SAP 再次荣获卓越职场颁发的「2020年大中华区最佳职场」奖项,也因为连续五年跻身这一榜单,SAP 由此摘取了「最佳职场」皇冠上的宝石 —— 获得了「传奇企业」称号,成为在大中华区首批获此殊荣的公司之一。 作为在 SAP 研究院这个传奇企业内工…

基于MATLAB的静态手势分割与识别研究

一、课题介绍 本课题设计了手势的分割与识别程序系统,结合 MATLAB软件对采集的目标图像进行识别。结合基于运动的手势分割与基于肤色的手势分割2种手势分 割方法,提取运动肤色区域,通过计算此区域的均值与方差矩阵更新高斯模型,设…

篮球 / 欧锦标赛最亮眼的三位球星

本季的欧洲杯篮球比赛成为另类的NBA较劲的场合,昨天字母哥、东契奇、约基奇都有不错的表现,其中字母哥的表现最为出色,希腊队战乌克兰时他单场豪取41分,帮助希腊以99-79击败乌克兰。 本次篮球欧洲杯字母哥莫过于视最闪亮之一&…

《钱进球场》:球场争锋·棒球1号位

动画《钱进球场》改编自森高夕次原作、足立刑事著同名体育漫画,于2017年3月宣布动画化 ,由STUDIO DEEN负责动画制作,于2018年4月6日起播出。动画第二期于2018年10月5日开始播出。全24话。 中文名 钱进球场 原版名称 グラゼニ 动画制作 Stud…

足坛十大最牛裁判:打边裁枪杀球员 红牌逐鹦鹉

足球场上,裁判的权力至高无上,可有些时候,这些黑衣法官展示权威的方式就不太可取了,更有甚者,他们的某些做法竟让人啼笑皆非。接下来,网易体育将会为广大球迷评选出10大最牛裁判。>>>>最强裁判…

迪赛智慧数——其他图表(平行坐标图):世界杯历史个人进球排名TOP10

效果图 2022年卡塔尔世界杯,全世界球迷翘首企盼,据悉,一共有67372名球迷入场观赛,为自己支持的球队鼓噪呐喊,释放蓄势积攒已久的激情。毕竟这一别,距离上届杯赛,已足四年!通过以上图…

[dhtmlxGantt(甘特图)开发手册]第三篇——语言设置、导出PDF/PNG、导出Excel/iCal等

1.简介 第一篇 第二篇 第三篇 第四篇 本文将介绍如何设置 dhtmlxGantt 的语言、导出PDF/PNG、导出Excel/iCal等等。 2.设置语言 顾名思义,语言设置可以让甘特图使用你希望的语言来呈现。 启用语言设置 ———————————————————————————…