AI 新时代,是时候重估百度了

ae354634b47bba8deb2ce31fcf387fcb.gif

2f9b4015cc9b074615a474b502ac53a5.jpeg

作者 | 北方

发力 AI 近十年,百度正在迎来最好的机遇。

2 月 22 日晚间,百度发布 2022 年 Q4 及全年未经审计的财务报告。2022 年全年,百度实现营收 1236.75 亿元,归属百度的净利润(非 GAAP)206.8 亿元,同比增长 10%。

第四季度,百度实现营收 330.77 亿元,归属百度的净利润(非 GAAP)53.71 亿元,同比增长 32%。2022 财年,百度核心业务连续四个季度业绩超市场预期。

除了公布财务业绩,对于近期备受关注的类 ChatGPT 产品「文心一言」,李彦宏在电话会上表示,文心一言将率先集成进搜索产品,通过新功能吸引到更多的用户,并给广告业务带来更多机会。

2022 年以来,百度围绕文心大模型展开了一系列动作。5 月,百度提出了「构建更适配应用场景的模型体系」;11 月,文心大模型全面升级,发布了包括 5 个行业大模型在内的 11 个大模型,同时发布了 AIGC 绘画产品「文心一格」。

关于即将发布的「文心一言」,截至目前已有爱奇艺、小度、智联招聘、太平洋汽车网等多个合作伙伴宣布加入百度文心一言生态圈。

7598d6a0d417f69ddea1ae97e44a1e75.png

基于长期建立的大模型体系,百度已有的业务体系也有望迎来新一轮升级。不论是百度自身的 C 端搜索产品,还是旗下的小度音箱等产品,都能够直接接入语言大模型的能力,获得性能和体验提升。

而以 AI 能力为优势的智能云业务,接入大模型能力后,也将能够向企业客户输出语音交互、内容生成的能力,赋能软件企业。

百度创始人、董事长兼首席执行官李彦宏表示,「凭借在 AI 领域的长期投入,百度将抓住即将到来的 AI 拐点,为我们的整个业务组合——从移动生态到智能云、自动驾驶、智能硬件等——开拓全新的机遇。」

01

核心业务持平,

多项主流业务与「文心一言」整合

2022 年对中国乃至全球互联网公司来说都是极其不易的一年。但整体来看,百度在 2022 财年的业绩表现依然相当稳健。

总体来看,百度的核心业务持平,营收增长由非在线营销收入贡献。李彦宏在财报会上表示,随着疫情缓解,在线营销开始出现复苏迹象。

2022 财年,百度核心业务营收为 954 亿元人民币,与去年基本持平。其中,网络营销业务营收为 695 亿元人民币,同比下降 6%。

非在线营销收入方面,2022 年的整体营收为 259 亿元人民币,同比增长 22%,主要由云计算和其它基于 AI 驱动的业务推动。

业务表现上,过去一年,百度搜索规模年同比增长 17%;移动端搜索查询次数和信息流分发量,均实现了两位数的同比增长。百度 App 月活用户数于 2022 年 12 月达到 6.48 亿,同比增长 4%。此外,2022 年前九个月,小度位居中国智能屏和智能音箱出货量第一。

在智能云业务上,百度 ACE 智能交通系统从 2021 年的 35 个城市扩展到 69 个城市,合同金额超过 1000 万元人民币。根据 IDC 2022 年上半年发布的中国公共云市场报告,百度第四年被评为第一大人工智能云供应商。李彦宏在内部信中表示,「百度智能云利用AI技术,为行业提供标准化的解决方案,提高了利润率。」

智能驾驶方面,截至 2023 年 1 月底,萝卜快跑累计订单量超过 200 万单。

2e817fff1d77c3003463b9658e64ee37.png

升级后的文心大模型体系|来源:百度

相比已经存在的基本盘,今天更受关注的还是百度在语言大模型方向的探索。作为百度乃至国内发布的首个类 ChatGPT 产品,文心一言的进展,背后的文心大模型,以及与现有业务结合的规划,都是外界关注的重点。

未来,百度主流业务将与文心一言整合。除了升级相关产品外,李彦宏强调了其对云服务的意义,「之前选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。这会根本性地改变云计算市场的游戏规则。」

02

始于四年前的文心大模型

ChatGPT 出圈,让普通人也感受到语言大模型的能力与优势。而在产业界,对于大模型的探索已存在多年。谷歌等公司 5 年之前开始语言大模型的布局。对 AI 技术持续投入的百度,也在 4 年前开始了大模型的技术积累。

谷歌 2017 年发布神经网络架构 Transformer 后,语言大模型开启了新时代。Transformer 能够让机器在处理语言信息时关注单词之间的联系,并预测接下来会是什么单词。这大大增强了语言的理解能力。如果将语言大模型比喻成复杂的建筑,Transformer 便是搭建时最好用的砖头。

在此之后,所有的大模型,都基于这一架构进行设计。2018 年,谷歌发布发布了基于 Transformer 的预训练大模型 BERT;Open AI 则发布了 GPT,这是 ChatGPT 的第一代模型。

紧随其后,百度于 2019 年发布了初代文心大模型:ERNIE 1.0。这也是文心系列模型的起点,初代文心模型基于谷歌 BERT 模型结构,增加了优化设计。

预训练模型大模型可以看作一种新的研究思路。在过去,自然语言理解有各种不同的任务,如翻译、知识问答、多轮对话等。解决每一个问题,需要专门训练出模型,但能力的提升却容易遇到瓶颈。预训练模型则换了另外一种思路,先用大量数据训练出一个具备基础语言理解能力的模型,再通过少量数据的微调,让其具备处理某种任务的能力。

文心大模型优化的一个关键点在于加入了知识图谱。作为一种信息加工方式,知识图谱将现实世界中存在的概念、以及相互关系用符号表示出来,最终形成一个可视化的「图谱」。将这种方式加入预训练,就增加了大模型在知识相关任务上的能力。

在训练数据上,文心大模型也有明显特点。基于百度自身的数据优势,训练模型的语料来自百度百科、百度新闻、百度贴吧、以及中文的维基百科。这其中包含了大量的知识性的语料。

2019 年 7 月,百度再次升级模型,发布了 ERNIE 2.0,并在 2020 年全球全球规模最大的语义评测比赛 SemEval 上,获得了 5 项世界冠军。发展至今,百度语言大模型文心一言突出的能力是「知识增强」,能够生成对话、进行文本创作。

大模型是未来 AI 产业体系的重要组成,但要把大模型用起来,还需要底层算力、上层应用的共同搭建。百度也在这一方向上进行了诸多实践。

8be2879951d05b877fbdd5ba97772a0b.png

「文心一格」平台页面 |来源:百度

直接支撑文心大模型的平台,是飞桨产业级深度学习框架。这是目前被广泛使用的深度学习框架。截至 2022 年 11 月底,飞桨平台上已凝聚 535 万开发者、创建 67 万个 AI 模型,服务 20 万家企事业单位,位列中国深度学习平台市场综合份额第一。在百度 AI 能力的整体架构中,深度学习框架位于第二层,整体的四层能力包括「底层芯片+深度学习框架+大模型+应用层」。

去年底,百度发布了最新的生成式 AI 产品「文心一言」,这是应用层的最新产品,目前已经被不少新媒体用来生产配图素材。这是一个 AI 作画平台,由飞桨学习框架和文心大模型提供技术支持。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,百度将文心大模型已经形成「模型层 + 工具与平台层 + 产品与社区层」的整体布局。

「文心一格」产品的发布,意味着百度已经开始积累大模型的工程化落地能力,而接下来「文心一言」产品的发布,将沿着这一方向进行更多探索。

03

「文心一言」融入更多业务

深度学习三巨头之一的 LeCun 表示,新的 AI 热潮,将带来企业内部深度学习研发的复兴。对于百度来说正是如此。与学术性质的研发不同,在企业中的技术研发,不仅仅涉及概念验证,还因探索与业务场景结合、规模化而需要更大成本。

如微软总裁纳拉德所说,AI 将从根本上改变每一个软件类别。如今,正来到了探索大模型与更多业务场景结合、赋能产品的加速时期。百度也已经公布了相关规划。

三月份即将发布的「文心一言」(ERNIE Bot)是基于文心大模型所发布的新的语意理解平台。从英文名 Bot 可以看出,底层的技术将是一个类似聊天机器人(Chatbot)的对话模型。「文心一言」将会利用跨模态、语言理解和生成能力等,为人们提供自然流畅的聊天体验。

对于百度来说,拥有了这样的新技术平台,首先能够提升的便是搜索产品。目前,搜索产品的收入大约占到百度整体收入的 60%,依旧是最重要的产品之一。

多年来,搜索产品的形态和用户体验没有太大的变化。当对话体验与原有的搜索引擎形成互补,用户在搜索相关链接的同时,也能够直接阅读定向生成的内容,将是十多年来搜索产品最显著的一次产品变革。这也将成为互联网的新流量入口。

这种对话能力,还能够接入智能座舱的场景中,以语音交互的形式体现。前不久的三里屯体验中心启动会上,集度 CEO 夏一平表示,「集度将融合百度文心一言的全面能力,支持汽车机器人实现自然交流的再进阶。」当新的模型能力接入汽车终端,人们在座舱内不仅能够通过语音对设备进行更全面的控制,还能够获得类似于和一个「人」交流对话的体验。

6b6b6950b7e59d8b2a6bdcd20900d9f2.png

集度概念车内景|来源:网络

除了 C 端产品之外,模型能力也将接入百度的智能云中,为 B 端服务能力带来提升。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,「文心一言」将通过百度智能云对外提供服务,率先在内容和信息相关的行业和场景落地。

将大模型的能力引入云服务,将是必然的趋势。微软此前已经表示,计划将 OpenAI 的多项技术引入 Azure 云服务中,包括 ChatGPT 以及绘画模型 DALL-E。将来,通过云服务的方式,AI 改写软件的进程才会真正发生。

百度智能云宣布,将在 5 月推出针对「文心一言」模型的 API 接口。这将使百度智能云在语音合成、机器翻译、自然语言处理方面的服务能力提升,客户可以直接调用相关能力应用到具体的场景里。

去年百度智能云年增长为 12%,在 AI 云市场位列第一。具体而言,在数字人、智慧城市等领域,百度智能云为市场份额第一。百度搜索业务之外的其它业务,主要受智能云及其他 AI 驱动业务的推动。大模型能力的接入,将带来更强的增长势能,也将拓展 AI 云的服务范围。

巴比特园区开放合作啦!

5523da8165669b4e7a996190978e227a.png

3899eeade67c194b069324d3494fa044.jpeg

0226eaab6195486ab8cf7c36bc04f036.gif

中文推特:https://twitter.com/8BTC_OFFICIAL

英文推特:https://twitter.com/btcinchina

Discord社区:https://discord.gg/defidao

电报频道:https://t.me/Mute_8btc

电报社区:https://t.me/news_8btc

1239e3b23cb8322eb858e9c0f469fbfb.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/61874.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pandas可视化中国近四年主要城市的GDP

pandas可视化中国近四年主要城市的GDP 数据来源于国家数据网:http://data.stats.gov.cn/easyquery.htm?cnE0105 效果如下所示: import pandas as pd import matplotlib.pyplot as plt from pylab import * mpl.rcParams[font.sans-serif][SimHei]gd…

中国城市公园规划建设行业运行状况与趋势预测展望报告2022-2028年版

中国城市公园规划建设行业运行状况与趋势预测展望报告2022-2028年版 第1章:中国城市公园规划建设行业发展综述1.1 城市公园规划建设行业界定 1.1.1 城市公园的界定与分类 1.1.2 城市公园规划建设行业界定 1.1.3 城市公园规划建设行业作用 1.2 中国城市公园规划建设行业进…

基于腾讯人口迁徙数据的全国城市网络结构特征分析

基于腾讯人口迁徙数据的全国城市网络结构特征分析 1 引 言 基于大数据的城市网络研究是近十年来城市研究的新方向,本文基于腾讯人口迁徙数据,从网络分析入手,通过度、转变中心性、转变控制力、等级划分等方面分析网络结构特征。分析表明&am…

pyecharts从入门到精通-地图专题Map-世界地图和中国城市地图

文章目录 参考安装与查看pyecharts地图实现-Geo数据集查看读取数据生成中文国家名称国家中文和英文名称字典:根据字典,生成国家中文名查看没有转换成功的国家中文有哪些过滤包含中文国家名的数据 可视化人口数据显示中国城市地图数据 拓展-pyecharts中Map源码拓展-p…

2021中国城市数据中心发展指数报告 附下载

数据中心是承载数据的基础物理单元,是算力基础设施的重要组成部分,是促进5G、人工智能、云计算等新一代数字技术发展的数据中枢和算力载体,逐渐成为各行业数字化转型的重要支撑,对于数字经济增长具有重要助推作用。 全国46个城市数…

【原创】1985-2021年《中国城市统计年鉴》900+全变量地级市面板数据 Python编程整理直接可用的城市面板数据

花费数月通过Python和手工整理把1985-2021年《中国城市统计年鉴》几乎所有统计指标分类统计出来,包括把所有数据分类别、把部分前后不一致的名称但实际是一样的指标统一、把全市、市辖区拆分出来。每个变量单独保存一个excel文件,再经过人工核对确保无误…

世界和平 - 中国国际友好城市数据集

一、中国国际友好城市总表 1、数据来源: 中国城市竞争力专题报告 2、时间跨度:1973-2015 3、区域范围:全球 4、指标说明: 该份列表记载了与全国各个城市结成友好城市的外国城市 数据示例如下: 二、中国与一带一…

关于 AI ,大家关心的问题

阅读本文大概需要 1.46 分钟。 兄弟们,自从我跟曹老师准备合伙做一个 AI 生态的新社群之后,很多人问我最多的问题就是: AI 时代对我们普通人来说意味着什么? 普通人又该如何去把握 AI 时代的机会? 那么,今天…

UI设计师用Midjourney生成界面的好用关键词

目前国内外已经出现了很多备受瞩目的AI绘图工具,其中我认为Midjourney是适合初学者的工具之一。对于那些对人工智能绘图一无所知但想尝试一下的新手来说,这是一个很好的入门选择。而且,现在的AI技术已经能够辅助设计,带来引人注目…

Word中公式编辑器mathtype中符号显示异常

在Word的MathType中部分符号显示异常,如“上弧形”无法正常显示,显示为方框,如下所示:正确的显示方式为:,却显示成了这样: 解决的办法是: 在Mathtype文件夹下MathType\Fonts\TrueTy…

录入数学公式至mark down文档的方法

1. 直接用md语法编辑公式 推荐:​​​​​​​ 在线LaTeX公式编辑器-编辑器 小技巧: latex代码转化为markdown时只需左右各加" $ "$公式$,公式可以嵌入文字中间$$公式$$(删掉,加是为了不转化为公式&#xf…

不输入公式,直接对话便能处理表格!chatexcel了解一下

前几天在网络上看到一个名为chatexcel的工具,不禁眼前一亮,赶紧去找的自己尝试了一下,效果超出预期。 网站网址附在文章最后。 话不多说,直接上界面: 打开网址,一种黑色系的简洁界面扑面而来,界…

word打latex公式显示不成功,出现【 打不出左大括号

我想敲这个公式 正常的latex代码应该是 f(x)\begin{cases}x, & \text{if }x\geq 0\\ax, & \text{if }x \leq 0\end{cases} 把latex代码复制到word后,发现公式不对 变成了这样 不识别"\begin{cases}"和"左大括号" 我这里用"\m…

虚拟主播神器Facerig

Facerig 2018年,著名虚拟主播,VTUBER絆愛(KizunaAi)火遍全世界。 Facerig就是可以让你的上半身变成虚拟主播的软件,它是一个steam独占的软件,所以首先你要有个steam账号。 目前2019-06-29,正…

虚拟直播时代来临,虚拟人主播和虚拟场景成线上发布会新直播形式

近日,奇瑞天猫官方旗舰店开启以“出发欧萌达 潮领新纪元”为主题的汽车行业首场实时全虚拟场景影院级直播盛典。同时,奇瑞虚拟推荐官达奇空降直播间完成首秀,与粉丝共同见证奇瑞跨次元车型OMODA5的炫酷超现实虚拟动态拆解,以更直观…

目前能体验到的虚拟主播虚拟人脸形象有哪些?

目前能体验到的虚拟主播虚拟人脸形象有哪些? 最近疫情严重,各大电视台纷纷退出虚拟合成主播的视频,主持人是电脑合成了,真正主持人在家隔离无法出门,于是利用合成主播录制节目播放,这样减少隔离也符合国家的…

什么是虚拟人直播?虚拟人直播怎么做?虚拟人直播怎么赚钱?附虚拟人直播教程

什么是虚拟人直播?虚拟人直播怎么做?虚拟人直播怎么赚钱?附虚拟人直播教程 农产品如何通过直播把货卖出去?虽然翻车了,但是佩服他们为农民解决销路问题! #我为家乡农产品代言 #三农 #永善县农特产 你抖音刷…

chatgpt赋能Python-pythonappium遍历

Python Appium遍历:提高移动应用测试效率的利器 什么是Appium遍历? Appium遍历是一种自动化测试技术,通过模拟用户操作在移动应用程序中对应的UI元素实现对应用程序的测试。与手动测试相比,Appium遍历可以在更短时间内完成大量测…

Android Studio运行报错:Illegal char <*> at index 0: *.lock

问题描述 Android Studio模拟器正常启动后,运行示例代码直接报错。 Illegal char <*> at index 0: *.lock结果项目无法启动。 解决方案 参考ChatGPT提出的解决方案,但不保证适用 ChatGPT对于该问题的理解:项目相关路…

对ChatGPT的后知后觉

前言 小编属于慢热的性格,chatGPT自2023年伊始,逐渐被各种形式推广,除了互联网技术行业的用户外,连在校的大学生也被吸引。尝试过后,不得不说确实是超出了小编对于AI领域的认知。接下来就和小编一起见证它带来的奇迹~ …