文心一言: 中国科技 “元实力” 的一次喷发

它没有摧毁,它改变了一切,

它制造了一些新的东西。



目录

勇气与厚积薄发的信心

“元实力”的一次喷发

为创新加油,让未来可期

获取源码?私信?关注?点赞?收藏?


用“不完美小孩”,形容目前的百度文心一言,再合适不过了。

“不完美”体现在,用户们连着五天测试发现,文心一言偏科较为严重:

是目前唯一能够直接进行“文生图”的模型,在文学创作例如诗词上有着“天赋”,但在“数学课”、“计算机编程课”较为差劲。

同时,文心一言也有着“小孩”的浮躁与诚实:

不得不说,前期造势过猛。Q4季度财报以及高管发言无不预告着,文心一言成为2023年及之后的主题曲:

在发给全员的财报信中,李彦宏重点介绍了将在三月份推出的生成式AI产品文心一言(ERNIE Bot),宣布计划将多项主流业务与文心一言整合。

同时2月份以来,各行各业接入文心一言消息不断,多次霸占新闻头条。

一顿操作猛如虎,让人误以为百度已经完完全全准备好了。

于是在发布会,高管诚实表示文心一言还不够成熟之时,股价应声而落:李彦宏诚实指出,自己体验时并不完美,这类大语言模型还远未到发展完善的阶段;首席技术官王海峰也提到模型目前“训练不够充分”。

文心一言: 中国科技 “元实力” 的一次喷发

“我们正处在一场新的重大科技革命的序章。”

这是“两会”之后的一个晚上,我在一场科技发展与新型举国体制的夜话中,不止一次听到的判断。

去年11月30日ChatGPT上线,人工智能迎来了iPhone时刻。3月16日下午,百度宣布正式推出基于百度新一代大语言模型的生成式AI产品文心一言(英文名:ERNIE Bot),也就是之前一段时间人们所期待的“中国的ChatGPT”。

当人工智能多年积蓄的力量喷薄而出,无数被其赋能的新物种、新应用的大爆发也就水到渠成。

勇气与厚积薄发的信心

从去年9月通过“健全关键核心技术攻关新型举国体制的意见”,到“两会”宣布重组科学技术部,组建中央科技委员会,科技创新在中国现代化建设全局中的核心地位已毋庸置疑,它既是未来中国经济的关键变量,也是高质量发展的最大增量。

在人工智能这一具有战略性、全局性、辐射带动性的科创高地上,中国将有何新作为?

百度推出文心一言最大的意义,可能不止于技术本身,而在于直面国际科技竞争赛场的格局与勇气,这是一个远比文心一言更重要的问题。

3月5日,科技部部长王志刚在十四届全国人大一次会议首场“部长通道”上说,中国在自然语言处理和理解方面进行了多年的研究,既要通过科学研究、技术牵引,又要通过场景驱动、用户需求,使得人工智能能为中国经济社会发展、为中国科技作出贡献。

他还谈到了ChatGPT,认为ChatGPT要做到算法的实时性和有效性并不容易。“从源头来看是自然语言理解、自然语言处理两个技术,之所以引起关注,在于它是一个大模型,对应大数据、强计算、好算法,原理是这样,就像踢足球都是盘带、射门,但要做到梅西那么好也不容易。”

从底层技术看,文心一言和ChatGPT都采用了SFT(模型微调)、RLHF(强化学习)、prompt(用户指令)等技术。

这跟大模型通过海量无标注数据的训练是不同的,还需要人的参与,作用是更好地理解人的意图,生成符合人的价值观、表达习惯的回复。

从演示看,文心一言和ChatGPT相比,在文学创作、商业文案写作、数理逻辑推算等方面的能力是“你有我有大家有”。但在中文理解上,文心一言非常领先,处于独一无二的位置。

这是因为文心一言的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,以及5500亿事实的知识图谱。

研究表明,数据规模大,参数达到千亿级,大模型就可能发生“智能涌现”,涌现出知识和逻辑推理能力。而百度不仅数据规模大,数据形态也最贴合回答和生成需求,在百度搜索中问答和生成类的搜索请求占比很高。因此文心一言大模型在自然语言问答和创意内容生成上有着非常突出的表现。

文心一言刚刚发布,就如同ChatGPT刚发布一般,注定有不完美的地方,但当其开始使用后,经由真实的用户反馈、开发者的调用和模型迭代,将飞速成长。

面对世界各个科技巨头躬身入局的大模型赛道,百度是全球第一个对标ChatGPT的互联网大厂,这不仅是一种魄力,更是一种厚积薄发的势能。

我在夜话中认识的一位投资人曾在百度人工智能部门工作多年。我问她怎么看文心一言。她说,Robin(李彦宏)可能是互联网公司创始人中最有技术情怀的,百度在人工智能方面投资最久、最多,人才和技术底子最厚,所以率先推出“中国的ChatGPT”是很自然的事。放在中美科技角逐的背景下,文心一言的推出更显重要,它证明在人工智能的这一关键应用上,中国并未落后。

“就像百度在无人驾驶方面投了几百亿,给今天的很多车企铺了路,其作用就像‘黄埔军校’一样,百度做科技,从来不止是服务于它本身。”

“元实力”的一次喷发

从眼下看,对消费者来说,文心一言的价值在于,当它嵌入百度搜索,用户能直接与大语言模型交互,实现搜索体验的升级。对企业来说,则丰富和强化了百度智能云的能力,通过向公众开放大语言模型,可以帮助企业主和创业者在云上构建自己的模型和应用,提高效率、帮助决策和改善客户体验。

接下来,文心一言将与小度进行集成,升级小度的智能设备和服务;也将整合到百度的Apollo智舱系列产品等汽车解决方案中,让智能汽车具备领先的人车交互体验。

事实上,在最近的一个月内,已有超过600家合作伙伴宣布加入文心一言生态,期待尽早用上最新的大语言模型。对他们来说,百度智能云所提供的不仅是存储、带宽、数据库等基本功能,更是包括飞桨和文心大模型等在内的全栈人工智能能力。

这里简单梳理一下百度的人工智能能力体系。

在进入人工智能时代之前,IT技术的技术栈一般分为三层:底层的芯片,中间的操作系统,上层的应用。

进入人工智能时代后,百度的理解是四层:芯片层、框架层、模型层和应用层,并以此展开进行布局,即:芯片层的昆仑芯,2018年发布后已部署了几万片;框架层的“深度学习框架”飞桨,截至2022年底飞桨平台上已凝聚535万开发者,创建了67万个人工智能模型,服务20万家企事业单位;模型层的信息分布大模型、交通大模型、能源大模型等等,以及应用层的搜索、智能信控、电力等等。

这一四层全栈能力体系的好处是,针对一些场景在四层之间有非常多的反馈,从而进行极致优化。比如在搜索场景上,百度的人工智能芯片已经优化了10年,是全球效率最高成本最低的,在搜索场景下可以超过全球优秀的通用芯片。

文心一言位于四层架构中的模型层,它只是AI系统中承上启下的一环,假如脱离整个架构无异于空中楼阁。假如框架层和芯片层不能满足模型的需求,即使模型再好也无法发挥最大效果。

虽然文心一言刚刚推出,但它生在一个充满阳光雨露的强大的生态中,与之相关的基础技术如深度学习、自然语言处理、大模型等百度已沉淀多年。

对于百度的大模型,这里也稍作回顾。

随着数据井喷、算法进步和算力突破,效果好、泛化能力强、通用性强的预训练大模型,开始成为人工智能产业应用的基础底座。2019年,百度推出了文心大模型ERNIE 1.0这一产业级知识增强大模型。通过大模型与深度学习框架的融合发展,百度打造了自主创新的人工智能底座,大幅降低了开发和应用门槛,真正发挥大模型驱动人工智能规模化应用的产业价值。

文心大模型已迭代到了ERNIE 3.0,每天接受数十亿用户的搜索请求和其他百度移动生态app的训练。百度以文心通用大模型为基础,和各行各业的合作伙伴一起共建行业大模型,从行业及企业的特有数据和知识中,融合学习,提升大模型对行业应用的适配性。

截至目前,文心行业大模型已经达到11个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域,在产业化落地的过程中使大模型真正赋能千行百业。

在我看来,在全球新一轮人工智能技术的普惠化、创造性应用的大潮中,着眼于芯片和算力的企业具备“硬实力”,着眼于算法和模型的企业具备“软实力”,着眼于垂直场景应用创新的企业具备“巧实力”,而全栈技术能力强、底层核心技术过硬,并能将技术广泛赋能于个人、产业、城市、交通以及社会方方面面的企业,则具备“元实力”。

中国经济需要硬实力,软实力,巧实力,更需要元实力。

天地成于元气,万物之生皆禀元气。“元实力”的积累,需要长期的积累。

无论是芯片层、框架层等技术架构的布局,还是算力、数据等要素资源的投入,百度在国内人工智能领域一直领先。近十年来,百度累计研发投入超过1000亿元。2022年核心研发费用达到214.16亿元,占百度核心收入比例高达22.4%。相比而言,谷歌、微软、亚马逊的研发费用率约为12%左右。

资料显示,跑通一次100亿以上参数量的模型,算力至少需要1000张GPU卡。即使不使用英伟达的A100顶级芯片,按一张GPU5万元的市场均价计算,1000张GPU也意味着单月至少需要5000万的成本。业界测算,GPT3的单次训练成本至少要460万元。众里寻他千百度,要千百次地训练,投入之巨可想而知!

以多年持续不断地投入和原生技术为基础,以中国庞大的消费端和企业端的反馈与优化为动力,百度已成为中国在人工智能领域的“元实力”代表,也担负着参与全球人工智能竞逐的重要责任。

文心一言的发布,正是这种“元实力”的一次喷发。

为创新加油,让未来可期

文心一言,从第一行代码到最后一行代码,以及整个训练平台,完全自研,是不折不扣的“中国创造”。

中国在人工智能领域的创新、创造,对整个中国经济的意义何在?我觉得目前的认识还是不够的。

我关注中国制造业几十年,最近几年有一个突出印象,就是中国制造经由数字化、智能化的加持,全球竞争力在不断提升,如智能电动汽车、新能源电池、智能家电和家居、无人机、机器人等等。数据驱动下的快速进化是这些产业的一个基本特征。

由于中国的数据规模优势和算法、算力不断上台阶,不断推升了中国制造之“智”。在跨境电商平台上,中国产品已经成了聪明产品的代表。

制造业是立国之本,强国之基,中国数字经济和人工智能的发展,则是聪明制造之本、智慧制造之基。在某种意义上,不仅卡脖子的材料和技术是中国制造的天花板,中国人工智能发展的水平也是中国制造的天花板。

由于缺乏对产业的深入了解,社会上有一种“制造业为实,互联网为虚;硬体为实,软件为虚”的浮泛之见,忽视了数字经济和制造业的深度融入,才能代表中国经济的未来。

今天需要非常鲜明地呼吁——要充分认识到中国互联网企业、软件企业、人工智能企业在整个国家产业演进中的战略意义,它们和中国的大国重器、行业龙头、硬科技企业一样,也是国之重器,也是硬科技。硬科技不只是硬邦邦的物体,而是指缺之不可的关键科技。软件就是不折不扣的关键科技,少了它,硬件就会变成运行不了的死件。

尤其在人工智能时代,所有经济活动都高度依赖数字基础设施。如同当年的Windows系统、Android系统一样,深度学习框架就是今天的“基础设施”,大模型就是通用人工智能时代的操作系统。阿里的王坚当年做飞天操作系统,华为自研鸿蒙系统,百度做出文心一言,都是“看不见摸不着”的软件生态,但没有它们,我们如何建设数字强国和制造强国?

中国已进入“科技创新定成败”的新发展阶段,企业是科技创新的主体,创新要发展,必须给企业一个安定、安静、健康、有利的发展空间。我们常常说要创新驱动,但创新往往是九死一生的,没有对风险的高容忍和分担机制,科创企业特别是民营科创企业,很难走远。

我们往往有一种误区,一谈创新言必称硅谷,却不去仔细研判硅谷的创新文化、风险投资机制、人力资本机制、资本市场支持、宽容失败的气氛,以及学术科研领域与产业界的紧密协同。对自己身边一些中国企业的创新,我们既缺少耐心,也缺少包容和鼓励。

其实回顾华为自研芯片的历程,百度人工智能投入的历程,在相当长时间都是非常寂寞的。作为民企,既要在市场上活下去,又要拿出真金白银做充满不确定的研发投入,研发成果的知识产权保障还很不完善,所以很多企业选择跟随,选择躺平。

而对李彦宏来说,他是一个技术信仰者,在人工智能领域倾注了最多的心血,他也是一个绝不服输的强者。他推出文心一言并不是要凑热点,而是要证明,在新的全球科技竞赛升级之时,中国人工智能企业可以站出来,应该站出来,也有信心站出来。

文心一言如何盈利?何时盈利?我想李彦宏也无法很好回答,但他还是出发了。人生总要做一些不斤斤算计的事,也许只是为争一口气:我们也能做,我们来了!

几年前,李彦宏的一句“要卷就卷创新”引发了很多网友的共鸣。今年1月10日,在百度举办的Create AI开发者大会上,他说:“芯片卡脖子很要紧,但软件卡脖子一样要紧。必须要把软件的根扎下去,才能让创新持续发生,才能让顶层的商业更加繁荣。”

“文章千古事,得失寸心知。”文心一言的发布,是百度显示科技“元实力”的一步,更是中国人工智能产业向全社会发出召唤的一步——请大家一起关注,一起参与,为创新加油,让未来可期。


2023年第三十二期,希望得到大家的喜欢🙇‍

希望大家有好的意见或者建议,欢迎私信


以上就是本篇文章的全部内容了

 ~ 关注我,点赞博文~ 每天带你涨知识!

1.看到这里了就 [点赞+好评+收藏] 三连 支持下吧,你的「点赞,好评,收藏」是我创作的动力。

2.关注我 ~ 每天带你学习 :各种前端插件、3D炫酷效果、图片展示、文字效果、以及整站模板 、HTML模板 、C++、数据结构、Python程序设计、Java程序设计、爬虫等! 「在这里有好多 开发者,一起探讨 前端 开发 知识,互相学习」!

3.以上内容技术相关问题可以相互学习,可 关 注 ↓公 Z 号 获取更多源码 !
 

获取源码?私信?关注?点赞?收藏?

👍+✏️+⭐️+🙇‍

有需要源码的小伙伴可以 关注下方微信公众号 " Enovo开发工厂 "🙇‍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8516.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从战略高度重视ChatGPT引发的新一轮人工智能革命

王明辉 国务院发展研究中心产业部研究室主任 任师攀 国务院发展研究中心办公厅(人事局) ChatGPT是一款由美国OpenAI公司开发的自然语言人机交互应用,拥有接近人类水平的语言理解和生成能力,是迄今为止人工智能领域最成功的产品和历…

一周 AIGC 丨王小川打造中国版 OpenAI,阿里版 ChatGPT 上线邀测

智能时代将再一次开启“文艺复兴”。每个人都会因为 AI 的助力而变得更加强大。用好 AI,一个人就可能做一个公司,解决之前难以解决的难题,也更容易成为自己想成为的人。社会也会更加扁平,以前少数人才能享有的智力服务&#xff0c…

“百模大战”愈演愈烈,AI大模型的现状与发展

最近,随着 OpenAI 发布的以用户为中心的聊天机器人 ChatGPT 的发布,大型语言模型 (LLM) 引起了人们的关注。大模型的好坏与否,主要涉及三个方面:算法、算力和数据。算法决定了其本身的学习能力,算力则影响着算法的学习…

打造ChatGPT的团队:平均年龄32岁!华人成员:清北+名校深造

文|凌敏 源|InfoQ 让全网沸腾的 ChatGPT,其背后团队不足百人。ChatGPT 发布以来,在短短 2 个月时间月活破亿,成为历史上用户增长最快的消费应用。 有分析机构感叹:“在互联网领域发展 20 年来,我…

CHATGPT启动人工智能革命 带来海量算力基础设施需求

事件刺激: 【科技创新】是我们近期关注的主线方向之一。近期科技部高新技术司司长陈家昌表示,下一步,科技部将把人工智能作为战略性新兴产业,作为新增长引擎,继续给予大力支持。随着政企投的结合,以及Chat…

【ChatGPT】大模型时代——开启人工智能新十年

2018 年以来,超大规模预训练模型的出现推动了 AI 科研范式从面向特定应用场景、训练专有模型,转变为大模型+微调+模型服务的AI工业化开发模式。直至对话大模型 ChatGPT 引发全球广泛关注,人们终于欢呼 AI 2.0 时代来了。当我们立足由大模型推动的AIGC元年,AI 正在迎来新的一…

ChatGPT带动下的AI产业链发展趋势

来源 | 融中财经 (ID:thecapital) 从 2022 年下半年开始,随着深度学习的发展,以 Diffusion、ChatGPT 为代表的颠覆性 AI 应用破圈,标志着人工智能领域的重大突破,引发全球共振。不少人将 ChatGP…

ai智能写作软件哪个好?分享这三款好用的软件

嘿,大家好吖!今天,我们要谈论一件非常有趣的事情——ai写作小说软件!是的,你没听错,现在连机器都能写小说了! 想象一下,以前我们只是觉得机器人能洗衣服、打扫房间已经很厉害了&…

AIGC学习,AI绘画、AI写作、国内外研究现状等

一、AI绘画 Midjourney 简介 Midjourney是一个由同名研究实验室开发的人工智能程式,可根据文本生成图像,于2022年7月12日进入公开测试阶段,使用者可透过Discord 的机器人指令进行操作,该研究实验室由Leap Motion的创办人大卫霍尔…

免费ai写作软件分享,ai写作软件大合集!​

免费ai写作软件分享,AI写作是指利用人工智能技术,让计算机程序自动生成文章、新闻、评论等文本内容,通过自然语言处理、机器学习、深度学习等技术,AI写作可以模仿人类写作过程,生成高质量、流畅的文本内容。AI写作的应…

快速简单对接【短信验证码】API接口

快速简单对接【短信验证码】接口 很多同学课程中都需要练习API接口对接,这里告知一个免费获取实名认证API接口的途径,也提供简单对接的使用方法。 整体过程说明: 1.下载postman软件 2.获取阿里云API接口的免费次数套餐 3.获取接口相关参数…

php 请求第三方接口发送短信验证码及注册手机号码

1:为什么要用短信验证码: 防范XSS和CSRF 2:php中怎样调用第三方接口(短信宝/京东万象/阿里云/容连云):post请求使用Curl();get请求使用file_get_contents() 服务端调服务端 前端调用后端接口 >ajax 3思路 第一步…

chatgpt赋能python:Python对接接码平台:提高效率的必备工具

Python对接接码平台:提高效率的必备工具 随着互联网技术的不断发展,越来越多的企业和个人都需要使用到短信、语音等类型的验证码进行验证,而接码平台则成为了这一领域的重要工具。Python作为一种最优秀的编程语言之一,其强大的功…

使用chatGPT + AI 绘图生成自己的专属头像

案例介绍 微信头像是朋友认识我们时的第一印象,或许是可爱、妖娆,或许是帅气、成熟,还有自然、厚重、调皮… 我们都有自己独特的故事,独特的思想,独特的爱好,对于头像当然有着自己独到的设计眼光。 接下来请允许我向大家展示如何使用chatGPT、AI绘图工具生成出自己的专属…

chatgpt赋能python:Python自动绘图实现教程

Python自动绘图实现教程 在数据可视化领域,绘图是必不可少的工具,可以帮助我们更好地理解和表达数据。而Python作为一种功能强大的编程语言,也自然可以实现自动绘图。 本篇文章将介绍如何使用Python自动绘图,包括以下内容&#…

简绘ChatGPT支持Midjourney绘图支持stable diffusion绘图

简绘ChatGPT支持Midjourney绘图支持stable diffusion绘图 配置前先看看你的PHP7.3有没有安装SG11扩展,有的话必须先卸载再进行环境配置 1.环境配置PHP7.3 2.PHP扩展安装redis3.安装运行组件 点击下载→ixed.7.3组件组件上传存放路径/www/server/php/73/lib/php/…

chatGPT AI对话聊天绘画系统开发:打开人工智能AI社交聊天系统开发新时代

人工智能技术的快速发展和普及,催生了众多创新应用,其中,AI社交聊天系统成为当下市场的热门话题,本文将详细介绍开发属于自己的ChatGPT的过程,并探讨当下市场因Chat AI聊天系统所带来的影响性。 AI社交聊天系统的潜力与…

如何构建您自己的 ChatGPT:无需代码的 AI

GPT-3(Generative Pre-trained Transformer 3)是2020年风靡全球的OpenAI开发的语言处理人工智能,具有类人文本生成、翻译、长文本总结等能力更多。几周前,OpenAI 发布了 ChatGPT,本质上是 GPT-3 的变体,它基本上破坏了互联网。正如预期的那样,很多人都在尝试使用经常崩溃…

独立产品灵感周刊 DecoHack #049 - 开发者如何学习UI设计

本周刊记录有趣好玩的独立产品设计开发相关内容,每周发布,往期内容同样精彩,感兴趣的伙伴可以 点击订阅我的周刊。为保证每期都能收到,建议邮件订阅。欢迎通过 Twitter 私信推荐或投稿。 💻 产品推荐 1. method.ac 这…

我们都需要刷新——读现任微软CEO萨提亚的《刷新》有感

“ Empathy(同理心、同情心)和 Growth Mindset(成长型思维)是重塑和变革微软文化的重要支点” 7月12日,我有幸参加在深圳的ArchSummit全球架构师峰会,在“汇丰架构转型实践——海量金融业务场景下的未来架构…