文心一言“插刀”百度?

f9bbe041927648441b5c0e39e5100f6b.jpeg

在ChatGPT出世半年,爆火将近2月后,中国版AI大模型终于崭露头角。

3月16日,百度于北京总部召开新闻发布会,主题围绕基于文心大模型技术生成式对话产品——文心一言,这也预示着中国首个类ChatGPT产品面世。在其正式推出前,市场早已波涛汹涌,首批生态合作伙伴阵容群星闪耀 ,兴业银行、科创信息、北京现代等超过650家知名企业及机构陆续官宣接入文心一言,寄希望抢占中国ChatGPT的第一波红利。

百度同时公布了文心一言的邀请测试方案。3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约,搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。

在此之前,AI大模型已在全球掀起军备竞赛,国际上谷歌、微软分庭抗礼,Brad、NewBing论战不断,国内闻风而动,百度、阿里、360、腾讯积极入场,AI FOMO点燃科技圈。其中,百度作为第一梯队传统的国产搜索巨头,All In AI之心尤为突出,市场甚至传言百度曾下3月必出产品的生死状,此前百度就已试水AI作画与产业级搜索引擎文心一格和文心百中。

在万众期待中,文心一言终于上线。无独有偶,近日OpenAI推出ChatGPT-4,在文本准确性与逻辑架构方面实现了更为惊艳的突破。而与此相比令人玩味的是,发布会召开后,百度股价不涨反跌,不少梗图频现,消费者对产品预期之低可见一斑。

54f930288716a9f89f2073bf033b913f.png

小小的发布会竟有如此奇效,不知百度是否心有悔意,其CEO李彦宏也直称文心一言并不完美,发布是因为有市场需求。对此,我们先来看看现场展示中文心一言的表现能力。

发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。尽管被指责为录播,但也在一定程度上展示出文心一言的基本内核,展示类别已基本代表了当下文心一言的极限能力。

在文学创作方向,问题主要围绕《三体》进行询问,包括作品信息、核心内容、续写创作,从其回答表现来看,问题准确性与上下文的逻辑联系性表现尚可,以搜索引擎论已属优异,但类人性不足,可明显感知信息多从语料资料库中集成而来,并无直接对话之感。

e319a0a2f126ef500a58494c92d402a2.png

在商业文案创作中,公司起名、Slogan、新闻稿创作能力更多侧重于考察语义的理解力,就这部分而言,笔者认为文心一言语义理解已可达标,在回答之余会自动增加冗余的额外解释,但整体内容更倾向于正确的废话。

27596592fc67406f354d7402c4e2ed0b.png

除了基本的文学方向,文心一言已可尝试解决含逻辑思维的数学推演题目,现场成功计算鸡兔同笼经典题型,并可发现题目中隐含的错误,但解答本质上和当下的小猿搜题、作业帮等第三方解题软件并无区别,部分与网页提取答案几乎一模一样。

fb899ded6b6c5d14f086fa76c57f1f8e.png

同时反观ChatGPT-4,其在各种专业测试和学术基准上的表现与人类水平相当,不仅以前 10%的超强能力通过了模拟律师考试,SAT成绩达到710,且具备解决高难度数理逻辑,拆解多语言复杂题型,量子速读看论文总结摘要的能力。两相对比,文心一言在其面前宛如蚍蜉撼树,而由于录播缺乏真实性,甚至有部分弹幕戏言中美人工智能的分界线即为中国有人工,美国有智能。

6651c9bfa14ed97922b4e88bc1f32239.png

6fe1f7c18fafbd094ae8ed3805d60c75.png

当然,文心一言也并未一无是处,起码在国内,其仍代表着第一梯队的水平。

仅从技术而言,与当前主流的BERT与GPT系列不同,文心一言核心引擎为百度自主推出的NLP模型ERNIE,2019年推出后,ERNIE已迭代至3.0版本。但从其发布论文来看,整体框架仍基于BERT模型改进,ERNIE1.0主要针对BERT系列中的中文表现进行优化,2.0则通过增加预训练任务,设计多任务学习最大限度地从训练语料库中提取词汇、句法和语义信息,而3.0则补充知识实体关系的同时兼顾语言理解与语言生成的统一预训练框架,将自回归和自编码网络融合加入预训练,在训练时引入大规模知识图谱类数据。根据百度官方数据,ERNIE模型参数规模达到2600亿,超过GPT3系列的1750亿元约50%。

而从模型差异看,两者都是基于Transformer模型架构,但GPT采用单向语言模型,而BERT采用双向语言模型,在实际操作时 GPT对于文本生成更为敏感,即如聊天、写作等语言生成方向表现优异,而BERT对于文本理解更为敏感,在问答、语义关系抽取更有优势。基于BERT的ERNIE自然也天然继承其优点,并在知识图谱生成中增加了该优势。

换而言之,仅以技术描述论,文心ERNIE类人性稍差,回答以精准理解为主,同时更多聚焦于本土化,在语义复杂的中文NPL处理中有显著优势,毕竟由于各种限制,即使是最新版本GPT-4测试的26种语言中也并未涵盖中文。实际问答题体验中,当涉及中文语义理解时,ERNIE表现突出,甚至部分胜于GPT3.5。

例如在关于洛阳纸贵的回答中,文心一言可正确理解其的经济现象,古诗词的可读性和观赏性也更高,更符合国人的审美与品味。

63301c9824a78f54da4bddb3aa55e867.png

同样的问题,对比一下老版本ChatGPT。可以看出,ChatGPT对此理解力相对较差,甚至开始胡编乱造答案,而在藏头诗的撰写中,拟定要求也与题干存在一定差异。

8c1f2d07b6c1024049480a5e182ea44e.png

另一可圈可点的方向是在多模态生成,文心一言现场AI生成文字、图片、音频、视频等能力较为亮眼,尽管技术在海报修改、方言输出仍相对有限,作为单一产品横向对标尚有难度,但从整体AIGC市场而言,表现已属不错。作为对比,尽管GPT-4已可识别梗图、漫画,但在多模态方向仍未公开其他数据,此点后续也可期待。

6f8b413c171bfe77a823e44a13742cc5.png

总体而言,尽管仍存在类人性差、输入限制等诸多不足,录播现场也无法判断流畅性与其他功能,但文心一言的语义理解、问答准确性以及逻辑能力已初步显现,但市场,显然并不买账。

在发布会的节点中,百度股价一度应声跳水9.81%,最低价格触及120港元,而纵观发布会现场的评论,也有众多用户发布看跌言论。

71bbfd49020eb0b14e31f3a6e632ddbc.png

究其缘由,无非是事前对文心一言抱有较高预期,而GPT-4的提前发布所展现的强大性能也让市场对于文心一言的比较门槛不断攀升。从性能来比较,百度除在中文语义占据天然优势外,在数理处理、语言能力、信息整合与类人性方面与之可谓是天差地别,当用户畅想与文心一言进行融合认知性与情感性的智能对话时,得来的结果与此前搜索引擎似乎并无差异,失望之情自然是溢于言表,而百度如此焦急的推出产品,也被市场理解为迎合需求的炒作,滥竽充数之称充斥于市场。

目前来看,AI大模型方向的中美之间代际差是真实存在的,除了高技术的算力算法、高质量数据、高密度人才的集中投入差外,现实的市场环境也难辞其咎。从长远来看,OpenAI接近10年的蛰伏与挥金如土的研发,离不开海外市场对硬科技强有力的后盾支持。而对于国内而言,商业回报是技术发芽难以逾越的鸿沟。在众多投融资场景中,工程化与商业化是中国创企必然要面临的灵魂拷问。然而,在中国快速发展的历史中,正是工程化的强大能力带来了互联网的弯道超车。

文心一言自然有很多的不足,但作为为数不多AI全栈布局的百度推出的国内首个AI多模态大模型,“文心”研发周期也超过5年,在时间与资源上的耗费并不以少论,但尽管如此,其首席技术官王海峰也无奈表示,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。

而从百度本身而言,在广告收入面临瓶颈的当下,其亟需寻找新的增长飞轮,云服务+文心一言已然成为了其发展的核心重点。根据百度发布的截至2022年12月31日的第四季度及全年未经审计的财务报告,2022年,百度实现营收1236.75亿元,其中百度智能云全年总营收177亿,同比增长23%。李彦宏在财报信中表示,百度计划将多项主流业务与文心一言整合,包括搜索、智能云、Apollo自动驾驶、小度智能设备等。此外,百度将开放文心一言大模型,支持更多企业构建自己的模型和应用,赋能交通、能源、制造等实体经济领域,实现生产效率的大幅提升。

从另一方面来看,尽管诸多不足,但文心一言在文案创作、引擎解答与音频方向的亮点也给人们的工作生活提供了新型的效率工具。对此,市场包容性的态度是否能给予其更长的发展周期?

百度的文心一言,让子弹再飞一会。

279ac5d069b95c14bda949652c4dab8a.gif

陀螺财经的联系方式

商务合作|投稿:

小黄(微信号 18925291949)

芒果(微信号 19925139144)

Ning(微信号 13631579042) 



推荐阅读

2149bcb6af9f44ae0ba7a02f6be6815d.jpeg14e719b8ec42e8e9765b90e29d315edc.png801f4064819d64d90c8a3532c1b5b303.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27881.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MSRA王晋东:大模型时代,普通人的科研何去何从

王晋东 投稿量子位 | 公众号 QbitAI 最近,电子工业出版社送了我一本《一本书读懂AIGC:ChatGPT、AI绘画、智能文明与生产力变革》,不禁感叹:现在连写书都这么卷了! 要知道,ChatGPT 于去年11月30日刚刚发布、…

ZadigX 发布:价值驱动一切 链接最酷玩家

Zadig 徜徉开源大漠,用爱发电两年之际,低调发布企业版 ZadigX,广泛链接一切价值创造者。发布会将在 2023 年 4 月 27 日 以全线上形式举办,特邀一位神秘总裁,两大车企总监,十大云原生盟主联创/CEO&#xff…

我是普通人,我居然可以这样借力ChatGPT?(此文不卖课)

昨天写了一篇《程序员,如何借力ChatGPT?》,分享了借助AI: (1)撰写通用代码; (2)协助寻找BUG; (3)协助优化算法性能; &…

没有ChatGPT和new bing ?加入文心一言!

前言: 话虽说ChatGPT和newbing已经席卷网络AI语言,当了现在ai的头号老大,但是那两个都是需要梯子才能使用,ChatGPT还需要付费,所以还是有很多童鞋是没有加入使用ai大军的,那我们不妨看一下这个:文心一言。 步入正题…

android自定义涂鸦,Android Studio:小Demo-“涂鸦”

一、在手机模拟器上显示一个图片 1、MainActivity.java里的代码 public class MainActivity extends AppCompatActivity { SuppressLint("ClickableViewAccessibility") Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanc…

android:在照片上绘制涂鸦

这个应该是简易版的美图秀秀(小伙伴们吐槽:你这也叫简易版的??我们看着怎么不像啊……)。好吧,只是在图片上绘制涂鸦,然后保存。 一、选择图片 这个道长有必要说一下,在绘制涂鸦时,笔画会根据…

通过触摸屏事件实现在图片上涂鸦——Android

目的:记录在屏幕上滑动的轨迹,实现在图片上涂鸦的功能 开发工具:Android Studio3.3.2 实现过程: 第一步:新建drawBoard.java用于自定义view 将图片放到drawable文件夹下,用BitmapFactory.decodeResource加…

涂鸦蓝牙协议移值(初级)

一、 移植前所需资料 ①获取涂鸦SDK包; ②基于我们芯片平台生成的库文件(将下面的图片发给涂鸦技术支持,然后会提供tuya_ble_lib_51802.lib); 【库不正确报的错误】 ③《涂鸦_ble_sdk_sdk说明_v2》文档; ④…

iOS 图片编辑——涂鸦——随手指移动随意画线

iOS 涂鸦 我们已经讲过画直线 和画带箭头的线段 参考:http://blog.csdn.net/lwjok2007/article/details/50885376 这节 我们尝试做一下 随意画 手指移动到哪里就在哪里画线 如下图所示: 使用Xcode创建项目,起名:TestFingerLine …

html5制作涂鸦板,HTML5实现涂鸦板

最近闲的,看了看html5,强大的绘图功能让我惊奇,于是,写了个小玩意---涂鸦板,能实现功能有:画画,改色,调整画笔大小 html5的绘图可以分为点,线,面,圆,图片等,点和线,这可是所有平面效果的基点,有了这两个东西,没有画不出来的东西,只有想不到的算法。 先上代码了…

Android对长图进行滑动涂鸦

由于项目需要对页面进行像做笔记一样的涂绘,所以这个功能点就应运而生,思路是加载完了页面以后就将整个截屏保存,进入编辑页面就将保存图片的地址传入自定义的长图加载控件中,高度的变化与滑动借助于一个修改过得竖直的seekbar,空…

AndroidStudio实现在图片上涂鸦并记录涂鸦轨迹

AndroidStudio实现在图片上涂鸦,并保存涂鸦轨迹 开个坑,终于有时间整理一下这个项目里用到的比较重要的技术 虽然最后甲方没有采用(笑) 因为博主学艺不精,有很多小bug AndroidStudio版本:2020.3.1.25 实现效…

仿微信图片编辑软件,涂鸦、裁剪、添加文本等常规操作

1、需求 在做一个野外地质数据采集软件开发的过程中,有时候需要进行拍照保存,在此,我们直接通过Intent调用系统的拍照功能;然后,调用系统的裁剪功能,可以按照需要的大小进行裁剪;但是但是但是。…

iOS 图片涂鸦功能

大致原理: 1.准备几张切图。 2.监听手势,手势开始,随机添加一张图片;手势移动,累加手势距离,到达一定值再添加一张随机图片并清零累加距离,依次类推。 demo地址:https://github.co…

抖音私信名片_抖音消息卡片_抖音跳转微信_抖音私信跳转_抖音落地页

近期见到许多人到求这一的信息卡片个人名片是怎么做的,我四处请人了解,总算找到这一卡片的做法。 这个是抖音内置的作用,它是抖音橱窗的一个作用,沒有开通抖音橱窗是完成不上这一作用的,得下开通橱窗作用,…

AI辅助编程,GitHub copilot chat 体验

最近,看到很多大佬分享 GitHub copilot chat ,据说能够让效率翻倍,抱着不相信,打假的心态我也弄一个,体验一下,结果真的很赞,下面分享使用 GitHub copilot chat 的过程 ​ 首先,我们…

工作完三年后,分享分享Java后端开发的一些心得

今年进入我工作的第四个年头, 三年多的时间里, 算上实习, 经历过3家公司. 见过了各种各样的同事, 也算见过各式各样的代码. 这篇文章主要是想分享一下一个java后端三年的一些感悟, 关于编程上的, 工作上的, 和同事相处上的. 一: 关于开发 我把关于编程的写在最前面, 我觉得对于…

打工人都在用的AI工具(第二期)

数量技术宅团队在CSDN学院推出了量化投资系列课程 欢迎有兴趣系统学习量化投资的同学,点击下方链接报名: 量化投资速成营(入门课程) Python股票量化投资 Python期货量化投资 Python数字货币量化投资 C语言CTP期货交易系统开…

一人改代码搞崩推特,马斯克气疯:全部重写!

鱼羊 丰色 发自 凹非寺量子位 | 公众号 QbitAI “马斯克气疯了”! 就在今天,推特又双叒崩溃了,图片和任何链接都打不开。 据马斯克自己的说法,原因只是“API的一个小改动”。 但后果很严重,起码在网友们看来&#xff0…

【真北直播笔记】董越:简明DevOps学习地图

缘起 真北敏捷社区的宗旨是:求知、连接。求知就是学习,家里没矿的话,学习是一个人最重要的动力之源。连接就是把人拉在一起,我们相信人与人的互动会带来美好的变化。今天的直播是把大家拉在一起学习,就是求知、连接。 …