文心一言背后,百度还是那个百度

对百度而言,文心一言不是一个结果,而仅仅是这家技术企业在过去多年投入的一个缩影和侧写。

作者|皮爷

出品|产业家

“第一枪”打响。

伴随着一身“工程师范”的李彦宏出现在台上,在市场备受期待的文心一言正式亮相。在发布会现场,作为百度的掌门人,他依次演示了文心一言的各项功能板块,并基于文心一言的特殊性和未来百度智能云的联动进行了阐述。

功能必然是值得且应该被核心关心的,包括文心一言的回答精准度,包括文心大模型背后的中文数据训练量,以及其能支持多模态的能力。

但在功能背后,一个更应该被思考的视角是,文心一言发布的价值是什么?

对于中国科技的发展,市面上往往有“跟随”和缺乏创新的论调,这种论调在PC互联网以及移动互联网都被一部分人诟病。但在如今的大模型时期,文心一言的出现似乎在向市场证明,中国在科技的创新能力,已经具备了和海外同台竞技的能力。

诚如李彦宏所说,文心一言是如今全世界唯一一个由大厂推出的生成式AI应用。在过去的一段时间里,尽管各家磨刀霍霍,但真正由大厂开发的生成式AI并没有出现。比如微软仅是调用OpenAI的能力,将其集成进自己的产品,而其他厂商如谷歌、Facebook等都没有成型产品的发布。

在当下的节点,文心一言更像一个特殊的“有勇气”的领头人。

关于百度,一个公认的点是百度一直是中国技术的代表企业,不论是被无数人推崇的“工程师文化”,还是百度对于AI长期以往真刀真枪的投入,这些在中国一众互联网大厂中都独具一格。

或者也更可以说,纵观中国科技行业,能够打响,并且能够打好大模型第一枪的,也只能是百度。

一、文心一言,打响中文大模型“第一枪”

第一枪。这是文心一言发出后,不少业内人士对它的评价。

文心一言到底如何?整体来看,中国大模型的第一枪,百度没有令人失望。

首先来看功能层面。从目前发布会介绍的功能来看,文心一言目前在公开场合演示的有文学创作、商业文案创作、数理推算、中文理解和多模态生成能力。其中,文学创作可以说是基于独特的中文大模型生成的,后续四个能力也都在现场做了不错的演示。

而在发布会之后,各方人士也纷纷对文心一言进行了测试。根据文心一言在市场反馈的程度来看,它的回答符合人们对其的预期,尤其是在中文语义的问题表达上,文心一言的表现甚至要高于市场预期,明显优于chatGPT。

一个背景信息是,文心一言背靠的是文心大模型。而文心大模型的定位是基于中文语义的知识增强大模型。从背后训练的数据来看,其训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这使得文心一言在中文语言的问题处理上具备天然优势。

或者也可以说,从使用体验来说,相较于chatGPT,文心一言更符合中国人的使用习惯。

在单纯的创作之外,一个市面上普遍的反馈是,文心一言在推理能力上也有不错的表现。除了李彦宏在现场演示的“比较”的问题,比如对某些计算相关的问题,文心一言也都有不错的回答,其答案的准确性、逻辑性、流畅性也都基本符合预期。

尽管文心一言后续的强预测和推理能力仍需要更多的测试,但人们的正向预期在发布后的几个小时内,就有了充分的良性反馈。

根据数据显示,截至3月16日晚间,百度智能云已经与5家企业完成首批签约合作,并与650家企业启动签约,申请文心一言的API调用服务测试的企业突破6.5万。而在3月17日港股开盘后,百度股价上涨超过10%。

二、“欢迎迈进大模型时代”

那么,为什么在当下产业数字化的节点,各个大厂对生成式AI,以及其背后的大模型有这么高的热情?或者也更可以说,为什么百度要在海外chatGPT推出的很短时间内,迅速推出自己的大模型?

关于大模型,一个通俗的定义是相较于之前的模型训练,其采用的数据更为原始和无秩序,模型框架可以基于深度学习的方式进行自监督学习,基于海量数据进行特殊的智能表达和推理运算。

如果对其做一个更精确的定义是,大模型或将是未来产业数字化的终极方式。

“未来会是大模型+行业模型的时代。”在百度阳泉智算中心的现场,百度智能云云计算产品解决方案和运营部总经理宋飞告诉我们,“在过去的几年时间里,百度已经帮不少企业落地了行业模型的模式。”

类似的形式不罕见。不单纯在国内的部分产业侧,在国外,微软推动的“通用行业模型+行业模型”也在成为各个行业数字化转型的依托。这样做的好处在于,企业可以基于自身的大模型进行内部不同环节的产业表达,比如营销、智能客服等等,帮助企业实现一定程度地智能,进而减少人员成本。

而除了企业内部自行测试之外,在模型被正式推出后,其可以利用外部输入的数据进行深度学习。换言之,伴随着模型被使用次数的越来越多,其智能化程度将会越来越高,模型本身也将越来越成熟。OpenAI推出的GPT大模型就是一个鲜明的例子。

除此之外,尽管当下不论谷歌还是微软,抑或是百度推出的通用大模型更大的预训练模式都集中在C端板块,但未来其将可以与其前端的SaaS应用,以及公有云和私有云产品进行深度耦合,进而提供一个具有实际生产力的工具。

对数字服务厂商而言,这是一个先发战。谁能率先跑出第一步,就能占据先发优势。

但这并不是一件容易的事情。以国外的预训练语言大模型为例,根据国盛证券报告《ChatGPT 需要多少算力》现实,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。以 ChatGPT 在 1 月的独立访客平均数 1300 万计算,其对应芯片需求为 3 万多片英伟达 A100 GPU,初始投入成本约为 8 亿美元,每日电费在 5 万美元左右。

这并不是一笔任何企业都能够且愿意投入的费用。那么,为什么在今天,百度会优先选择站在舞台之上?答案同样是业务本身。

从当下百度的业务模式来看,其上到百度智能云业务、无人驾驶,下到小度等智能终端,以及百度固有的基本盘搜索,本质都可以与文心一言以及文心大模型有足够强的连接力和协同力,且有强加持。

此外,从实际投入来看,早在2019年,百度就已经推出了文心大模型ERNIE 1.0。在2021年,百度又基于ERNIE发布了全球首个百亿参数的对话大模型PLATO-XL。

截止目前,百度最新发布的ERNIE 3.0 Zeus,已经拥有千亿级参数,并具备智能创作等各类自然语言理解和生成任务。与业界其他模型相比,其在公开数据集上的小样本学习、理解和生成任务效果也已经处于非常领先的水平。

换言之,在当下大模型时代即将来临的当下,百度需要并且有能力构建自己的生成式AI产品,以此更好地满足市场需求。此外,通过此,也更能展现中国企业在过去十年里基于技术上的投入和科技厚度。

一个形象的比喻是,如果说OpenAI打开的是AI发展的一道门,那么百度本身已经在这个AI的门内腾挪。

三、我们应该如何理解文心一言?

再说回文心一言产品本身。在打响中国生成式AI产品第一枪背后,我们应该对文心一言有一个怎样客观评价和感知?

综合来看,目前文心一言的表现有惊喜,也有不足。但在chatGPT成为大模型时代的唯一代表的当下,不可否认的是,文心一言正在成为一个中国大模型的新代表。

这种代表不单纯在产品本身,也更在其背后文心大模型代表的中国企业的新侧写。比如百度是如今全球为数不进行全栈布局的人工智能公司,这次文心一言背后的技术栈,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有领先业界的关键自研技术,并且几乎全部是自研产品。

再比如,百度拥有强大的算力基础,其目前拥有阳泉、徐水、定兴三个云计算中心,仅阳泉一个智算中心,就承载着24万台服务器,为大模型的研发提供着强大的底层支持。

同样因为这次文心一言,还被人知道的是百度一直保持的压强式、马拉松式的研发投入。比如在2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。

也可以说,在文心一言发布背后,市场能看到的不单纯是产品本身,也更能看得到中国企业愈发强大的技术实力和为技术持续投入的决心。

此外,在投入之外,百度也恰是在自证。即能感知到的是,伴随着文心一言的发布,百度也在开始享受自己多年技术投入带来的红利反哺,比如文心一言将会给百度智能云强大的AI加持,能给客户提供更为彻底和更为专业的数字化服务,同时结合“通用大模型+产业模型”的形式,为企业打磨自己的模型。

实际上,在过去的几年时间里,百度已经基于文心大模型为客户提供行业模型的解决方案,比如和国家电网一起打造的电力大模型等等,这些模型层的解决方案也终将会反哺到底层的算力层,推动百度智能云的增长和强服务力。

对百度而言,文心一言不是一个结果,而仅仅是这家技术企业在过去多年投入的一个缩影和侧写。“做自己擅长的事情。”这是百度的最真实写照。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12710.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面向chatgpt编程——编写简单的数据录入工具

标题面向chatgpt编程——编写简单的数据录入工具 最近业务上有个需求,需要采集某些公司披露的年度报告中的信息,因为 pdf 解析工具的效果不太理想,因此需要人工查找录入到oracle数据库。为了提高效率,我借助chatgpt搭建了一个小型…

ChatDOC,文档版ChatGPT,可以上传文档并解析,与你的文档对话

引言 ChatDOC是一个基于ChatGPT的文件读取助手,可以 快速从文档中提取,定位和汇总信息 特点 阅读速度更快,学得更好。 – 上传研究论文、书籍、手册等!询问有关您的文件的任何信息,并在几秒钟内获得易于理解的答案一…

【RPA进阶】 高级数据操作

🐋作者简介:博主是一位.Net开发者,同时也是RPA和低代码平台的践行者。 🐬个人主页:会敲键盘的肘子 🐰系列专栏:UiPath 🦀专栏简介:UiPath在传统的RPA(Robotic…

ChatGPT会取代RPA?ta自己可不是这么说的!

先说一个AI热知识:ChatGPT 的推出在科技界引发了一场狂潮。 聊天机器人ChatGPT以及其背后的AI大模型GPT,在2023年引爆全球。GPT 全称为 Generative Pre-trained Transformer,是一种使用人工神经网络的深度学习技术,能够使机器像人…

Chatgpt超级写手+RPA采集工具,解决内容创作问题的自动化神器

你是否曾经为了寻找优质内容而感到束手无策?是否曾经因为时间成本高而感到头疼?是否曾经因为原创难度大而心生畏惧? 作为一名内容创作者,你一定会深有体会。如何在这个信息爆炸的时代中找到最优质的内容,是每个内容创作…

10几个国内AI大模型,让你的工作学习效率翻倍!

文章目录 前言1.道和顺ChatIC2.星期五3.文心一言4.讯飞星火认知大模型5.通义千问6.商汤-日日新7.Moss8.ChatGLM9. 360智脑写在最后 ✍创作者:全栈弄潮儿 🏡 个人主页: 全栈弄潮儿的个人主页 🏙️ 个人社区,欢迎你的加入…

刚刚!商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此...

金磊 发自 凹非寺量子位 | 公众号 QbitAI 国产ChatGPT之战,已然是大步迈进白热化阶段。 就在刚刚,商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat)。 单单是这个名字,便值得说道一番。 商量的“商”&am…

商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此【转载】

国产ChatGPT之战,已然是大步迈进白热化阶段。 就在刚刚,商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat)。 单单是这个名字,便值得说道一番。 商量的“商”,不仅体现了它是商汤自家“商字…

商汤版ChatGPT,有点牛逼,超预期了

金磊 发自 凹非寺 量子位 | 公众号 QbitAI 国产ChatGPT之战,已然是大步迈进白热化阶段。 就在刚刚,商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat)。 单单是这个名字,便值得说道一番。 商量的“商”&a…

商汤版ChatGPT来了!基于千亿参数大模型,谈笑风生,有“商”有 “量”!

来源:量子位 国产ChatGPT之战,已然是大步迈进白热化阶段。 商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat)。 单单是这个名字,便值得说道一番。 商量的“商”,不仅体现了它是商汤自家“商字…

商汤版ChatGPT发布千亿参数大模型:商量!开放API ,体验实录在此!

来源:量子位 | 公众号 QbitAI 国产ChatGPT之战,已然是大步迈进白热化阶段。 就在刚刚,商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat)。 单单是这个名字,便值得说道一番。 商量的“商”&am…

商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型!

编辑 | 量子位 点击下方卡片,关注“自动驾驶之心”公众号 ADAS巨卷干货,即可获取 国产ChatGPT之战,已然是大步迈进白热化阶段。 就在刚刚,商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat)。…

商汤加入 ChatGPT 战局,发布“商量”语言大模型!

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 近日,AI 大模型落地的机器人应用赛道上,多了一位新成员——商量(SenseChat),它是由商汤科技研发而成,和 ChatGPT 有些类似&#x…

商汤版 ChatGPT 正式发布

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未 来源:量子位 | 公众号 QbitAI 国产ChatGPT之战,已然是大步迈进白热化阶段。 就在刚刚,商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat&…

常用的外贸英语口语汇总

一. 关于询盘,有哪些外贸英语: May I have an idea of your prices? 可以了解一下你们的价格吗? Can you give me an indication of price? 你能给我一个估价吗? Please let us know your lowest possible prices for the …

外贸询盘、对话、常用话术英语(上)

外贸常用话术 1 I’ve come to make sure that your stay in Beijing is a pleasant one. 我特地为你们安排使你们在北京的逗留愉快。 2 You’re going out of your way for us, I believe. 我相信这是对我们的特殊照顾了。 3 It’s just the matter of the schedule,that is,i…

调戏chatGPT(二)下围棋

这次我准备和chatGPT下盘围棋,我先得确认它知道围棋是啥,如果会的话我就不用介绍规则了 t 你会下围棋嘛 作为一名AI助手,我可以模拟下围棋的过程,但是我没有实际的感官,无法看到棋盘和棋子,也无法进行实…

打卡智能中国(三):一位水厂文员的多重身份

跟全国各地、各种岗位的工作者交流过,福建某自来水工厂的小夏,是令我们团队都印象深刻的一个。 这个1997年出生的男孩,用现在流行的话说,一毕业就顺利“上岸”了,回老家成了一名负责党政工作的文员。在“早中晚一天三盅…

亚信科技新“三驾马车”再创佳绩,与数字经济同频共振

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 近日,亚信科技公布了2022年财报。财报显示,2022年,亚信科技实现营收77.38亿元,同比上升12.2%;毛利润29.39亿元,同比上升11.1%,毛利率达38.0…

ChatGPT参加了2023高考数学,它的分数超过你了吗?

前几天,我们让ChatGPT写了高考作文。 有人说写得层次分明、条理清晰,感慨自己幸好早早毕业,不然就要被ChatGPT超过了。 有人则认为ChatGPT写的作文中规中矩、平淡无奇,十分正确但没有什么意义。 今天,我们准备再让Chat…