文心一言 vs GPT-4实测!百度背水一战交卷

GPT-4发布一天之后,压力全部给到百度这边。

就在刚刚,百度交卷。

文心一言,百度全新一代知识增强大语言模型,正式在百度总部“挥手点江山”会议室里发布。

在一片静寂的氛围里,李彦宏小步登场,语气里带着点紧张:

大家的期望值,是我们对标ChatGPT,对标GPT-4,这个门槛有点高(笑)。
十月怀胎,我们就带大家来看看这个AI大模型文心一言长什么样。

此前,有人狂转meme图把百度比作GPT-4旁边的垃圾箱。

也有人鼓吹百度是全村的希望。

而在发布会进行的同时,百度港股市值大幅下跌,相关话题还冲上了微博热搜。

但直播弹幕中也有网友点赞:

那么这个中国版ChatGPT到底实力如何?

咱们就用百度发布会演示的预录制Demo,对比一下崭新出炉的GPT-4,先凭实力说话。

文心一言 vs GPT-4

和GPT-4一样,文心一言是一个多模态大模型

李彦宏开场就展示了文心一言具备的5种能力,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成

文心一言甚至还现场秀了一口接地气的四川话,现场网友发出一片笑声。

其他能力如何?我们具体展开来看。

文学创作

在文学创作上,李彦宏一开场就搬出了《三体》作者刘慈欣坐镇。

先让文心一言介绍一下大刘,“毕竟我也是刘慈欣老乡嘛”:

看起来没什么问题。同样的问题问问GPT-4呢?

嗯???直接把刘慈欣的老家挪到了湖北省洪湖市。湖北人狂喜。

随后,李彦宏又展示了从哲学的角度对这段文章进行续写的demo:

看起来中规中矩,比较理性。老样子,我们也来与GPT-4进行一波对比:

这波你是想看GPT-4续写的《三体》,还是文心一言的?

再来看看《三体》电视剧中扮演史强和汪淼的老搭档,于和伟和张鲁一,有什么共同点?

也没什么问题。

就是看起来展示的速度有点快,比李彦宏的语速还要快上那么一点点(手动狗头)。

商业文案创作

接下来,李彦宏又展示了一下文心一言在商业文案创作上的能力。

比如给新公司起个名字。

并且这个名字它还不是瞎起的:

再来看看GPT-4起名的效果?

看起来,GPT-4对中文的掌控能力相比之下还是少了一点精髓。

至于写个公司成立的新闻稿?对文心一言来说似乎也不成问题:

数理逻辑推算

数学能力,是考验生成式大模型的一大难题。ChatGPT刚上线时,也翻了不少车。

不过在现场,文心一言处理的数学问题不算复杂,是小学数学竞赛常见的鸡兔同笼问题。

彩蛋是,李彦宏现场展示的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不对。

修改一下题目,OK,再扔给文心一言试试:

看起来,答案还算是有理有据,一步步逻辑推理出来的那种。

李彦宏表示,这些题“不敢说百分之一百能做对,但至少体现了文心一言的思考历程”。

中文理解

接下来,李彦宏着重展示了一下文心一言对中文的理解能力,并特意强调:

文心一言对中国文化的了解,理应超出任何一个预训练大模型。

一上来就是一个成语,“洛阳纸贵。到底有多贵?”

这是文心一言的效果展示:

还解释了一下这个成语背后的经济学原理:

那么,将这个问题抛给GPT-4呢?首先问问它,知不知道洛阳纸贵是什么意思:

接下来,再问问他对应的经济学理论是什么:

这波看起来,GPT-4的中文理解似乎也不输文心一言啊。

那么,再来看看二者写藏头诗的能力?

首先是文心一言的效果展示:

接下来,我们再看看GPT-4怎么说:

诶,看起来反而是GPT-4没有真正理解“藏头诗”的含义。

这波文化理解上,属实是文心一言“小胜一筹”了。

不过在英文上,李彦宏也承认,虽然文心一言也能处理,但能力是显著不如中文的。

这也和百度目前能用到的训练数据有关。

多模态生成

最后,李彦宏还简单展示了一下文心一言多模态生成的能力。

首先来看看,为即将到来的2023世界智能交通大会创作海报——

而除了前文展示过的文字转四川话能力,文心一言还能文字转视频

李彦宏一句指令“将以上内容生成视频”,很快啊,不到几秒钟,文心一言就把字幕和视频做好了:

有些遗憾的是,在ChatGPT被频频称赞的编程方面,文心一言并没有现场展示相关能力。

但王海峰透露,文心一言的训练数据中同样包括代码。

文心一言如何“跑通”?

正如ChatGPT脱胎于OpenAI的GPT系列,百度这次推出的文心一言(ERNIE Bot),背后也正是基于文心大模型技术打造。

据王海峰介绍,文心一言主要脱胎于两大模型:

百度ERNIE系列知识增强千亿大模型,以及百度大规模开放域对话模型PLATO。

在此基础上,主要采用了六项核心技术

其中三个是广为人知的大模型技术,包括有监督精调、人类反馈强化学习(RLHF)和提示构建。

p.s. 人类反馈强化学习也是ChatGPT的关键技术。

另外三个,则是“百度比较有特色”的技术,包括知识增强、检索增强和对话增强技术。

首先来看与ChatGPT类似的技术:有监督精调、RLHF和提示构建。

有监督精调,尤其指中文方面的数据精调。百度基于对中国语言文化和中国应用场景的理解,筛选了特定的数据来训练模型。

至于人类反馈的强化学习(RLHF)和提示构建,操作上也与ChatGPT大差不差。

随后是百度提出的、用于进一步改善模型效果的技术。

知识增强,包括知识内化和知识外用两个部分。其中,知识内化即将知识“渗透”进模型参数中;知识外用指的是模型可以直接使用外部的知识。

检索增强,则与百度搜索引擎积累的检索技术有关。

百度将把检索技术和生成技术结合起来,先对内容进行检索后,将比较有用的部分用于生成,再整合输出结果:

最后是对话增强部分,包括之前百度积累的记忆机制、上下文理解和对话规划等技术:

概括来看,文心一言表现出的能力,被李彦宏称为“智能涌现”:

当参数达到千亿量级,训练语料达到足够多的情况下,这种现象就会发生。

目前,百度拥有的AI技术可以分为四个部分,芯片(昆仑芯)、框架(飞桨)、模型(文心)和应用。

之所以软硬件都要布局,百度称,是为了降低成本

生成式AI需求的算力非常高,费用相当昂贵。
因此,如果在四层架构之间相互进行协同优化,就能让它的效率比别人更高,从而显著降低成本。

李彦宏认为,这也正是百度的优势所在:

四层都有领先产品的公司,绝无仅有。

这次文心大模型背后的硬件算力,也是通过百度智能云提供服务。

目前,文心一言已经接入百度搜索,目的在于提升搜索资源效率。

同时,包括小度和自动驾驶Apollo等产品,以及爱奇艺等公司也已经接入百度的文心一言模型。

网友:看来还不用提前退休

截至发稿,百度港股股价在一波明显下跌之后,有所回弹。

发布会结束,网友反应最多的是“提前录制有点败好感”:

对于这一点,李彦宏的解释是,给出的问题都比较长,为了节约现场时间,所以才用了提前录制的形式。

还有不少网友对文心一言展示出的能力不太满意。有人调侃,看完之后感觉“提前退休的日子看起来还可以缓一缓”:

离GPT-4还差了20个老胡。

还有网友感觉,文心一言的发布会像极了毕业答辩的自己(doge):

不过也有网友表示,希望能给国产产品一点时间一点耐心。

发布会末尾,王海峰宣布,文心一言将从今天开始对外进行测试,包括个人用户和企业用户。

是骡子是马,相信接下来,会得到更多验证。

One More Thing

对了,有网友表示,已经拿到了文心一言的内测资格:

你好,感谢您体验文心一言,体验地址: https://yiyan.baidu.com/welcome,希望您在体验当中给予更多意见,文心一言邀请码:KFCVME50RMB,2023年3月16日24:00前有效。

嗯,万物疯狂星期四。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25893.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

快捷工具箱小程序-做你的小树洞

今天闲来无事,发现了一个有趣的小程序-做你的小树洞,包含ChatGpt小机器人 小程序总体界面是这样的 这个小程序里边有很多有趣的小功能,最让我喜欢的就是藏头诗的创作。仅仅需要输入关键词语,然后就能够进行创作诗句,他…

藏头诗生成器

一个藏头诗生成器的小程序,自定义文字即可生成一首诗词。 该小程序通过机器学习,预训练8万多首诗词,5千多个韵词,能通过关键词生成押韵的藏头诗,也可以生成藏字诗; 在生成结果页面,可选择复制…

ChatGPT + MindShow 三分钟搞定PPT制作

制作一份“通用性”的PPT需要几步? 三步 接下来,我们借助ChatGPT和MindShow,大概三分钟完成操作,就能制作出来完胜大部分人的PPT文件。具体可看文末效果导示。 解锁更多AIGC(ChatGPT、AI绘画)玩法&#…

狼人杀凉了,贴着AI标签的剧本杀如何构建自己的商业版图

文 | 魏启扬 来源 | 智能相对论(ID:aixdlun) “天黑请闭眼”。 这是“狼人杀”的开场台词,也可用来形容“狼人杀”的现状——前景黑暗,惨不忍睹。 2017年,“狼人杀”的热度达到顶点,无论是线下…

百变大侦探剧本杀开启新玩法!等你一本正经胡说八“倒”

“1234” “4321” 小时候的你有玩过这样的游戏吗? 当你一本正经的胡说八“倒”时候,童年的趣味就在游戏间。当然,正所谓“一千个读者就有一千个哈姆莱特”,游戏也是一样!一千个用户就有一千种玩法,但游…

【洞见研报】剧本杀行业研究报告——告别野蛮生长,剧本杀如何“杀”出一条合规路?

剧本杀起源于西方宴会实况角色扮演推理游戏谋杀之谜(Mistery of Murder),是一种围绕剧情演绎进行的真人角色扮演推理游戏。游戏全程由 DM(游戏主持人)负责引导,通常有1-10位玩家参与,游戏时长1-5小时不等。…

景区剧本杀小程序解决方案

景区剧本杀小程序可以通过以下解决方案实现: 确定需求:定义剧本杀小程序需要实现的功能和特性,例如角色选择、游戏规则、游戏流程等。 设计UI和UX:设计剧本杀小程序的界面和用户交互流程,使其易于使用和操作。…

基于Spring+SpringMvc实现的足球队管理系统,java技术经理岗位职责

1.账号密码错误 2.账号密码正确,却没有登录权限 3.网络异常 4.正常登录 2.主界面 管理员主界面:教练组主界面 :球员组主界面:

基于Spring+SpringMvc实现的足球队管理系统

项目编号:BS-XX-018 本项目基于SpringSpringmvc实现了一个足球队管理系统,系统功能完整,页面简洁大方,适合于毕业设计使用。下面展示一下系统的设计结构以及系统功能。 系统功能结构图: 管理员(球队经理&am…

厂长说关于嵌入式当前的门槛和分工的变化

厂长说关于嵌入式当前的门槛和分工的变化 ///插播一条:我自己在今年年初录制了一套还比较系统的入门单片机教程,想要的同学找我拿就行了免費的,私信我就可以哦~点我头像黑色字体加我地球呺也能领取哦。最近比较闲,带做毕设&#x…

前端工程师的自我修养:React Fiber 是如何实现更新过程可控的

前言 从 React 16 开始,React 采用了 Fiber 机制替代了原先基于原生执行栈递归遍历 VDOM 的方案,提高了页面渲染性能和用户体验。乍一听 Fiber 好像挺神秘,在原生执行栈都还没搞懂的情况下,又整出个 Fiber,还能不能愉快…

单纯形法笔记

目录 对偶&#xff1a; 单纯形&#xff1a; 0.618法 newton法 最速下降法 F-R 共轭梯度法 K-T 条件 wolfe简约梯度 罚函数 障碍函数 对偶&#xff1a; 得到初始单纯形表之后 若检验数均 < 0&#xff0c;则对偶可行 若b均 < 0,则原始单纯形不可行 选取b中最小…

全球所有科学家影响力排名第五!这位中国院士到底有多厉害?

>>>> 前段时间&#xff0c; 一个重磅消息轰炸了世界学术圈&#xff0c; 来自全球最大学术出版商&#xff0c; Elsevier公布的&#xff0c; 2020年全球所有学科科学家&#xff0c; 排名数据显示&#xff0c; 我中科院王中林院士&#xff0c; 终身科学影响力排名世界…

JUC进阶-NO.3 说说Java锁

文章目录 ⭐NO.3 说说Java锁一. 乐观锁 & 悲观锁1.悲观锁2.伪代码3.乐观锁 二. 通过8种情况演示锁运行案例,看看我们到底锁的是什么1.8种锁案例(1). 标准访问有ab两个线程&#xff0c;请问先打印邮件还是短信(2). sendEmail方法暂停3秒钟&#xff0c;请问先打印邮件还是短信…

运动用品品牌排行榜,双十一运动好物选购清单

健身运动就像打游戏一样&#xff0c;如何区分你和其他玩家的差别呢&#xff1f;有时候靠身材&#xff0c;当然有时候也会拼装备&#xff0c;那么这些运动装备能否增加buff呢&#xff1f;是否值得入手呢&#xff1f;作为一名资深的运动爱好者&#xff0c;下面我就从实用角度聊一…

健身运动装备有哪些?双十一运动健身装备选购指南

近年来&#xff0c;各地的各种运动赛事越来越多&#xff0c;对运动也是非常好的推动。很多名人都开始运动起来&#xff0c;因为运动之后多巴胺分泌&#xff0c;让人觉得神清气爽。隔几天不运动&#xff0c;就让人浑身不自在。当然运动也要注意方式方法、注意姿势&#xff0c;还…

以数字化视角看世界杯,我预测荷兰夺冠

编者按&#xff1a;2022世界杯隆重开幕&#xff01;各路英豪齐聚卡塔尔&#xff01;让我们从一个ITer的角度&#xff0c;用数字化的视角&#xff0c;看看谁能最后夺冠&#xff01; 本文已经得到原作者张戈授权&#xff0c;在此表示感谢&#xff01; 真不是嘚瑟。 我是有40年球龄…

别人熬夜看世界杯 我熬夜改代码 你满意了

2022年卡塔尔世界杯正如火如荼地进行着&#xff0c; 一边是热火朝天的比赛&#xff0c;一边是让人惊掉下巴的爆冷结局&#xff0c; 但正因为这些不确定因素&#xff0c;反倒让世界杯增添了几分魅力和乐趣&#xff01; 小编在看球赛的过程中&#xff0c;不禁起了联想&#xff…

【进度2】从阿里云迁至腾讯云,并添加网站备案号

注&#xff1a;在阿里云备案成功网站域名不可以直接解析到腾讯云服务器&#xff0c;会被腾讯云的DNS拦截并跳转。 腾讯云服务器从2023.2.1-2023.2.15限时优惠&#xff0c;这里我选择的是2核2G这个。 HTML源码和备案号的添加 由于域名之前在阿里云和工信部已经备案过&#xff0c…

浅谈明日方舟游戏系统

主要玩法&#xff1a;敌方阵营从敌方初始点进入战斗并且沿着怪物前进路线行驶到己方保护目标。玩家可以通过部署干员守护己方保护目标&#xff0c;防止敌方阵营进入&#xff1b;当保护目标的生命值为0时&#xff0c;则战斗失败&#xff0c;任务结束。 1 干员系统 1.1 职业分支…