背水一战,百度发布文心一言

来源:机器之心

在业内人们的认知中,能造出国产 ChatGPT 的公司里,百度排名前列,然而文心一言发布前夕,OpenAI 率先发布了功能更为强大的多模态大模型 GPT-4,巨大的压力给到了百度这一边。这一次,文心能否回应人们的期待?

距离 GPT-4 发布仅 37 个小时后,答案就被揭晓了:

1443f55603aac6799a9cf70045fd373a.gif

3 月 16 日下午,百度正式发布了知识增强大语言模型「文心一言」。

「这段时间不断有人问我:你们为什么现在发布,你们是不是真的 ready 了?」百度创始人、董事长兼首席执行官李彦宏说道。「其实自 2019 年起,每年文心大模型都要发布一个新的版本。文心一言的发布是我们过去多年努力的自然延续。」

文心一言当然是要对标 ChatGPT,甚至 GPT-4。李彦宏表示,在全球大厂中,这样的产品百度是第一个发布的。

既然文心一言正式登场了,那肯定要上手试试。在现场,百度展示了文心一言在文学创作、商业文案、数理逻辑、中文理解和多模态生成方面的能力。

续写《三体》,文字生成视频

昨天下午,李彦宏总共展示了五个案例,介绍文心一言的能力:

首先来体验一下文学创作。关于知名科幻小说《三体》,李彦宏和文心一言进行了一番对话:

9dc4a5486a136d7f26ea5da25ec4b34e.gif

具体来说,「总结三体的核心内容」体现了文心一言的总结与分析能力,而续写《三体》体现了内容创作生成能力,再到「于和伟和张鲁一有哪些共同点」、「于和伟和张鲁一谁更高」这类问题背后,体现的则是文心一言的推理能力 —— 它需要先知道两人的准确身高,才能得出正确答案。

21f7f06c720d808979d3041c30c1e210.png

接下来,李彦宏还展示了文心一言的商业文案创作水平,包括给一家科技公司起名字、写 slogan、写新闻稿。

49023e7b9371c897ae347a6ddcc80ecc.png

AI 要写好一篇稿子,除了需要准确理解我们的意图,还要有清晰的表达能力。

「对于语言大模型来说,这背后需要庞大的数据规模作为基础。人类常说『读万卷书』,而 AI 是『读书破千亿卷』。文心一言大模型的训练数据就包括万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及 5500 亿事实的知识图谱等,这让百度在中文语言的处理上,能够处于独一无二的位置,」李彦宏说道。

越来越多的研究和实践表明,大模型在参数体量达到某个量级时,就可能发生「智能涌现」,即使在没有专门训练过的领域,也能涌现出知识理解和逻辑推理能力。

我们无法将所有能力一一教给 AI,但通过大量数据的训练、数十亿的搜索请求,大量图片和知识图谱中的事实,在不断的训练过程中,文心一言拥有了通用化的能力。不知道文心一言目前的参数达到了多少。

第三个案例,是大家喜闻乐见的「数理逻辑推断」—— 李彦宏向文心一言发起了一个鸡兔同笼的挑战。

eb9b193316c98f6259fd660ecc2bac17.jpeg文心一言可以告诉你题出错了。

对于第一道题目,文心一言经过演算,认为可能是题出错了。

对于第二道题目,文心一言不但给出了正确结果,还详细给出解题步骤。

也就是说,文心一言能理解题意,并产生正确的解题思路,进而像学生做题一样,按正确的步骤一步步演算出正确答案。同时,它也具备敢于质疑的品质:不是我错了,也许是题目错了呢?

可以看出文心一言已具备了一定的思维能力,能够学会数学推演及逻辑推理这类相对复杂任务。

「文心一言的数学能力在过去一个月的内部测试中不断进步。当然,现阶段准确率还不是 100%,我们还需要给它更多的时间来学习和成长。」李彦宏说道。

作为国产大模型,李彦宏展示的第四个案例,就是「中文理解」。

f9b14f20df0fbd0f81b298930f4cd047.jpeg

这是一些其他大模型应该无法准确回答的问题:

f71ce8009536b631a62059755ba71291.png

解释「洛阳纸贵」、写「藏头诗」,还要「答出其中蕴涵的经济学原理」,嗯,这很考验 AI 对中文和中国文化的理解。百度文心一言的中文水平优势也体现得淋漓尽致了。

李彦宏强调,作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力。同时他坦承,文心一言目前对英文语种、代码场景的训练还不够多,表现还不够好,接下来还要加紧训练,不断完善这些能力。

多模态是未来的方向,最后一个案例展示了文心一言的多模态生成能力:

21de379ce55a488d630925dc7b3cd2ec.png

先是文生图和语音生成能力,然后有意思的来了,李彦宏说:「请将以上内容生成视频。」

b9c01b5c54fb0650b879aeb2849a1cc7.gif

文心一言接连生成了文本、图片、音频和视频,展示了多模态生成能力。「视频的生成功能还没有完全开放,这是因为计算成本比较高。目前,每天已经有几万篇百家号文章的视频是通过这样的技术实现分发的。」李彦宏表示。

但需要注意的是,这和 GPT-4 上的多模态理解并不是同一个方向。

大模型是革新生产力的工具

无论是 ChatGPT、GPT-4 还是文心一言,大型语言模型还远未到发展完善的阶段,自然语言表达能力、逻辑推理能力在不断的发展过程当中。有时候会有很惊艳的表现,但不少场景下细究起来还有明显的 bug。

「但有一点是肯定的,它的技术会快速发展,未来一定会实现很强大的能力,」李彦宏做出判断。「文心一言会成为每个人必不可少的生产力工具。」

李彦宏认为,在人工智能时代,IT 技术栈发生了根本性变化,从「三层」变成「四层」:芯片层、框架层、模型层和应用层。

5f5a680329130a0de86aac344a6b1941.png

文心一言处在模型层。AI 时代的应用,将基于预训练的基础大模型进行开发。而纵观全球,在芯片层、框架层、模型层和应用层四层都有产品积累的公司为数不多,百度是其中一家。

「未来在文心一言的迭代速度上,你们会有感受,」李彦宏说道。

目前,已有 650 家企业宣布接入文心一言的生态。「生成式 AI 代表了新的技术栈,创造市场需求的爆发式增长。超强的自然语言理解、表达和推理能力。大模型能让任何公司距离自己的客户更近,人们能创造更好的客户体验,建立更强的竞争优势。」

百度认为,未来脑力劳动者的工作效率可以提升四倍,人们的工作方式会发生不可逆转的改变。

李彦宏也展望了生成式大模型带来的新机会:

9a6d0570e027fd9c616fc235eb760ce0.png

第一,新型的云计算,未来的服务提供方式将成为 MaaS(模型即服务)。主流商业模式从 IaaS 变为 MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务,未来更多会看框架好不好、模型好不好以及模型、框架、芯片、应用这四层之间的协同。

第二,行业模型精调。通用大模型和企业之间的中间层,具有行业 Konwhow,调用通用大模型能力,为行业客户提供解决方案。文心大模型,已经在电力、金融、媒体等领域,发布了 10 多个行业大模型。在各行各业都有机会。

第三,基于大模型底座进行应用开发,即应用服务提供商。当前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D 等场景,已经涌现出很多创业明星公司,这些公司很可能就是未来的新巨头。每一家企业在这个阶段都有机会。

在李彦宏展示完文心一言的 Demo 之后,百度 CTO 王海峰上台分享了背后的技术与百度多年的技术积累。

王海峰表示,文心一言是新一代知识增强大语言模型,是在 ERNIE 及 PLATO 系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE 和 PLATO 中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。

在演讲的最后,王海峰说文心一言目前已经开放测试。即日起,首批用户可通过邀请测试码在官网体验产品。百度智能云即将面向企业客户开放文心一言 API 接口调用服务,在官网可申请加入文心一言云服务测试。

以上就是百度今天发布会的内容了。看完发布会,相信每个人都有自己的感受。有人也许对百度没做现场 Demo 不满,也有人愿意宽容看待。

我们不得不承认,百度至少迈出了一步。接下来,就是看国内在这方面能不能越走越快。

推荐阅读

  • 西电IEEE Fellow团队出品!最新《Transformer视觉表征学习全面综述》

  • 润了!大龄码农从北京到荷兰的躺平生活(文末有福利哟!)

  • 如何做好科研?这份《科研阅读、写作与报告》PPT,手把手教你做科研

  • 奖金675万!3位科学家,斩获“中国诺贝尔奖”!

  • 又一名视觉大牛从大厂离开!阿里达摩院 XR 实验室负责人谭平离职

  • 最新 2022「深度学习视觉注意力 」研究概述,包括50种注意力机制和方法!

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 2021李宏毅老师最新40节机器学习课程!附课件+视频资料

欢迎大家加入DLer-计算机视觉技术交流群!

大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

6d5f3da00381eca05d533d1ddb373625.jpeg

👆 长按识别,邀请您进群!

be73f1e4116f857264554f6a7ce1d117.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/37426.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

顶着压力,百度发布文心一言,邀请测试开启

欢迎关注“ 计算机视觉研究院 ” 计算机视觉研究院专栏 作者:Edison_G 扫描二维码 关注我们 发布会撞车又如何,百度也拿出了多模态。 转自《机器之心》 在业内人们的认知中,能造出国产 ChatGPT 的公司里,百度排名前列,…

马云真回国了吗?专访元理先生告诉你真相。

最近,马云先生回到中国引起了广泛的关注和热议。作为中国商界的传奇人物,他的言论和举动一直备受瞩目。此次回到中国,不仅是个人的喜事,也代表着他在商业领域的再次回归。现在我们采访国科大经管学院MBA导师元理先生来分析下&…

安装国际版firefox(火狐浏览器)并设置语言为中文

访问https://www.mozilla.org/zh-CN/firefox/new/?scene2下载、安装;访问https://addons.mozilla.org/zh-CN/firefox/addon/chinese-simplified-zh-cn-la/并点击“添加到firefox”(如下图);重启firefox。 转载于:https://www.cnb…

火狐浏览器添加扩展之安装Tampermonker

1.进入火狐浏览器 2.点击右上角的这个图标 3.选择最下面的管理扩展 4.在寻找更多附加组件里面输入Tampermonker进行搜索 5.点击添加到Firefox 6.点击右上角的添加 7.点击右上角的好的 8.在火狐浏览器首页上点击新添加的Tampermonker扩展,选择获取新脚本 9.在搜索用…

Firefox在iOS设备上登陆国际版账号

发现在iOS上不管是国区还是美区,下载下来登陆都是国内版的Firefox账号 解决方法:在手机端Firefox上打开下方最右边的三个横线的菜单–>设置–>关闭本地同步服务即可 这个菜单翻译名字太误导人了,我以为是不再连接互联网同步了&#x…

Firefox火狐浏览器使用小技巧

firefox是现在非常流行的一款浏览器,功能强大并且能够为用户创造一个开放,创新与机遇的网络环境,因而在全世界各地都有很多的粉丝,好像用Firefox取代IE浏览器成了某种时尚。下面小编就为大家分享一些Firefox的使用小技巧&#xff…

如何用火狐浏览器firefox模拟手机浏览器客户端

打开火狐浏览器firefox. 点击工具->附加组件。 下载一个User Agent Switcher组件后点击安装。 安装完成后重新启动火狐浏览器 打开火狐浏览器后看工具菜单下面有个 default user agent ,点进去有一个iphone3,点击一下,就可以摸似Iphone3浏览器浏览手机…

国际版firefox安装方法

firefox的优秀品质当然毋庸置疑。 但是之前安装firefox的时候,是直接在firefox中文网上下载的,多了几个插件倒是无所谓,除此之外还有较为明显的广告行为。 对于这种国际开源的浏览器来说不应该啊,于是搜索了一下,发现…

【转载】在Firefox国际版使用中国版账户

之前一直都用Firefox中国版,但是最近从网上看到中国版Firefox夹带很多私货,怕了,但因为中国版服务器快、稳定,不想搬到国际版账户,(Mozilla表示过,用户的个人信息在服务器上是加密的&#xff0c…

如何下载火狐国际版

对于中国大陆用户,当在浏览器内键入 https://www.mozilla.org的时候,会自动跳转到https://www.firefox.com.cn在该页面下载的火狐,被称为火狐国内版,或者说谋智版.对于想要一个干净的浏览器的用户来说,肯定是要下载国际版的,国内版的有太多问题了(具体就不说了). 那么如何下载火…

用谷歌还是火狐?手机端还是另外选择其他浏览器吧

很多人都知道谷歌浏览器的用户量排第一,国外浏览器市场主要以Chrome为主。火狐浏览器因其可安装插件多,同步书签方便等优势被很多人喜爱。那么,在国内使用谷歌浏览器还是火狐浏览器比较好?可能一部分人这两个浏览器都不选择&#…

关于火狐浏览器国际版和国内版的说明

关于火狐浏览器国际版和国内版的说明 版本查看 版本查看:菜单-帮助-关于,下图是表示谋智版本的火狐。 两个版本主要的区别 谋智版增加了几个扩展,包括附加组件管理(提供找回关闭的标签页按钮和拖拽搜索功能,据说还提…

在Firefox国际版使用中国版账户(火狐通行证)傻瓜解决办法

更新://……国内版的扩展在这:http://mozilla.com.cn/moz-addon.html 在Firefox国际版使用中国版账户(火狐通行证)傻瓜解决办法-论坛-深度科技 (deepin.org) 之前一直都用Firefox中国版,但是最…

GPT-4 性能炸天:10 秒做出一个网站,在考试中击败 90% 人类

一、GPT-4,吊打ChatGPT! 一觉醒来,万众期待的 GPT-4,它来了! OpenAI老板Sam Altman直接开门见山地介绍道:这是我们迄今为止功能最强大的模型! 二、GPT-4,新功能一览 究竟有多强&am…

优美的曲线-turtlesim

从开环到闭环的旅程-CoCube 优美的曲线-译 2022年所公开博客案例所有项目,都在2020年之前完成,并且全部经过3轮以上测试。 当完美实现闭环之后,画曲线那就可以随心所欲啦。 想画什么,就能画什么。 核心代码: float …

UUID的弊端以及雪花算法

程序员的成长之路 互联网/程序员/技术/资料共享 关注 阅读本文大概需要 8 分钟。 来自:blog.csdn.net/m0_62946761/article/details/129033121 一、问题 为什么需要分布式全局唯一ID以及分布式ID的业务需求 在复杂分布式系统中,往往需要对大量的数据和消…

【C++笔记总结】面向对象编程——封装 |C++

文章目录 前言一、类的封装1.1、公有,私有,保护1.2、类的定义和类的实现相分离1.3、构造函数,析构函数,拷贝构造函数1.4、静态数据成员和静态成员函数1.5、友元函数,友元类 二、类的实现——对象2.1、对象的静态分配&a…

自然语言处理

1. 自然语言处理任务 1.1. 语言的特点 词汇量大、特征多、类别多;语义信息丰富且隐晦,同义词、近义词、反语等;语言之间有差异性。 1.2. 自然语言处理 vs 语音识别 语音识别是把声学信号和文字进行相互转换;自然语言处理更多…

高性能内存池设计【传统内存管理的弊端以及解决方法】

文章目录 🍎常用的内存操作函数🎂传统内存管理的弊端⭐弊端一⭐弊端二⭐弊端三⭐弊端四 🚀解决方法⭐内存管理工具选择⭐内存池技术 🍎常用的内存操作函数 void *malloc(size_t size);void *calloc(size_t nmemb, size_t size);v…

paper文献和科研小工具

一、好用的网站 Aminer 二、好用的工具 ​1. SciSpace SciSpace官网 【ChatGPT 论文阅读神器】SciSpace 用户注册与实战测试 SciSpace是一款基于 ChatGPT 的论文阅读神器。 2. ReadPaper 强大且超实用的论文阅读工具——ReadPaper ReadPaper官网 ReadPaper下载链接 Rea…