文心一言,站在奥林匹亚

df3ed3d72d0716028aabf4f6e3cf72d5.jpeg

1932年7月,在洛杉矶举办的第10届夏季奥林匹克运动会上,一个只有几人组成,运动员仅1人的代表团完成了注册参赛。他们经历了无尽的辗转波折,漫长的海上漂泊,最终来到了奥运赛场上,他们来自——中国。

来到赛场,本身就证明了很多,改变了很多。时至如今,中国的奥运之旅已经跨过了90年。我问文心一言,中国在奥运赛场上取得了哪些成就,它从金牌、奖牌、成绩、覆盖项目四个领域进行了归纳,并总结道,“中国代表团在夏季奥运会上取得了辉煌的成就,金牌数量和奖牌总数均位居世界前列,同时在多个项目中也实现了历史性突破”。

c987a5ac65b48c59f3874390656487b8.png

3月16日,当百度向世界展示文心一言的时候,我脑海中首先浮出的是这么一句话:中国AI终于来到了奥运赛场上。

我们为什么会如此期待文心一言?是对技术革命的热忱,对生产力的渴望?这些当然都有,但更加急切的是,对中国科技能否真正参与到这轮科技革命的担忧和焦虑。

文心一言究竟做到了吗?

我们第一时间拿到了文心一言的测试资格,就让我们从最真实的产品表现出发,回溯这条参赛之路。

站在赛场

55362713e02495a47d462ddf5f8840dc.png

我相信任何人都不会认为,近期爆火的大语言模型其价值仅仅在问答,它即将引发出的广泛性科技创新是清晰可见的,带来的价值远远超过其基础。

从2012年深度学习技术成型,到2016年因为数据集测试效果优秀与AlphaGO的良好宣传效果,第三次AI崛起正式开启。2018年,预训练大模型出现,经历了数年时间,ChatGPT等应用正式通过大语言模型的形式引爆了技术能量,这可以被看作AI复兴的2.0形态,是当之无愧的时代焦点。

最重要的是这场比赛才刚刚开始,如果能够第一时间参与到全球主流竞争,意味着中国AI可以参与到竞争规则制定,为上下游发展获得先手时机,创造出符合中国经济与社会需求的战略周期。

那么,文心一言拿到这张宝贵的“参赛券”了吗?

3月16日下午,在新闻发布会现场百度创始人、董事长兼首席执行官李彦宏向各界展示了新一代知识增强大语言模型文心一言在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五个使用场景中的综合能力。但大家肯定会更加好奇,展示效果之外,文心一言的实测、实用情况究竟如何?

当晚,我们就拿到了文心一言的测试资格,对其进行了全方位“拷打”。话不多说,直接上文心一言与ChatGPT的对比,全程无修改无打码。我们选取了大家最关心的,也是应用度最高的几方面问题进行测试。需要提前说明的是,生成式AI的答案每次都会不同,因此我们的测试结果不一定与其他媒体或用户完全一致。

1.数理逻辑能力

能够理解数理逻辑,回答复杂问题,一直被视作是ChatGPT的最大特色。那么在这方面文心一言能力是否可观呢?我们请出了中国人最熟悉的数理逻辑问题——小学奥数,来为大家解答。以一道非常经典的行程问题为例,文心一言的答案是这样的:

2ed9289a98d47fc5b128d8cfd8abb9bc.png

可以看到,答题过程虽然简略,但核心计算过程是非常清晰的,并且答案准确无误,到这里可能效果还没有拉满,那我们不妨看看ChatGPT同一个问题的答案:

1751f73d48180140cf5956a568f5df5b.png

8e0b8c8116b4fe130ee5120cbb6d6248.png

嗯,解题过程非常华丽,但最终结果似乎是欺负我没上过小学。事实上,直到如今ChatGPT依旧有大量类似问题,可以概括为“一本正经地胡说八道”。结果经常出错这件事,对于生成式AI的可信度、可用度其实是大打折扣的。相比来说,文心一言显然在逻辑与中文的理解上不落下风。

2.中国文化理解

我们知道,对比一家美国公司的AI模型中国文化理解能力,似乎有失偏颇。但对于中国开发者和用户来说,AI对中国文化和语言的理解就是核心诉求,这点是毫无疑问的。那么,在这个领域上文心一言 vs ChatGPT会有怎样的表现呢?

先来看一个关于唐诗的问题吧。关于李白和王维的艺术风格,ChatGPT是这样回答的:

69b9fc7970f3360a8a05646eb1e5c029.png

而同样的问题,文心一言的答案则是这样的:

f3b0846b65d53465fecc79e4ccd37a8d.png

77eabeb4758ed4810454c98e5f3edbe9.png

虽然ChatGPT的回答也很不错,但显然对于李白“诗仙”、王维“诗佛”这个最重要的艺术内核根本没有涉及。无论是知识科普还是专业回答,ChatGPT的答案显然都不能得到高分,而文心一言的回答则更加全面细致,且总结归纳能力更强。

我们再来问一个明清小说的问题,关于《红楼梦》的情节,ChatGPT是这样答的:

76a21679d09eb5c52b981ce15d2c1e0c.png

bde0cb48e3ab5f07e9bca2466069fb3c.png

而文心一言的答案,似乎从逻辑调理上就与ChatGPT完全不同:

ae365fa46a2e7f6e531a99a7f4d1c369.png

057a73793edfeb7b19df3d6b554ba0a7.png

这就又不得不吐槽了。ChatGPT回答的不是“主要情节”,而是“包含哪些内容”。相反,文心一言则确实梳理了主线情节的条理,并且给出了主线与副线关系的理解。在此基础上,对《红楼梦》的内涵做出了具有深度的解析。

对比下来,ChatGPT明显又犯了答非所问的毛病。但不管怎么说,两个AI对于中国文化瑰宝的理解,似乎都值得我们大多数人羡慕和学习。

3.最新信息查询

对于我们大多数人而言,都肯定是希望AI问答能够帮助我们了解世界最近发生的事情,了解那些最新的消息和动态。但ChatGPT即使在升级GPT-4之后,依旧采用了到2021年为止的数据,这也是其广受诟病的一个问题。那么,文心一言能不能接入最新、最近的信息呢?

我最近一直没时间追番,于是问了问文心一言《名侦探柯南》的最新情节:

4a23ebb0dbab7dcd269381ea78681428.png

为了确定这就是最新剧情,我又问了这是哪一期:

1b34c4dcdd4fd7507a88151e64a5c03f.png

可如果同一个问题问ChatGPT,会得到怎样的答案呢?

75a4eca076b6df36e00885003ebc7f71.png

好吧,它委婉的告诉我,想知道就滚去自己看......显然,获取最新的知识、新闻、动态,也构成了文心一言的独特优势。

4.多模态生成

这一点,目前还是文心一言的专属能力,ChatGPT并不具备生成图片的功能。可能有人会认为以文生图有专门的模型。但不可否认的是,合并到同一个问题系统中,带给用户的便捷性是十分明显的。既然ChatGPT还没有类似能力,那我们就让文心一言生成一张图片,结束我们的测试部分:

ee4bbf3d2085930d8aa7150107c762b4.png

可以看到,无论对刺客信条还是钢铁侠的理解,文心一言都是能够找到“那个味”的。

至此,我们可以坦然且真诚地说:文心一言或许并不完美,在很多地方与ChatGPT互有短长。但真的有自己的技术优势,更加实用,更加理解中国语言与文化,也更符合中国用户的需求。

文心一言,真的拿到了大语言模型的决赛资格。

45ace778efa8187999fe893346ecb055.png

水到渠成的参赛之路

那么我们不禁要问,这背后的原因是什么?为什么又是百度抓住了这个至关重要的战略机遇?这里面有什么运气或者玄机吗?答案或许非常简单,仅仅有“水到渠成”四个字。

8edb177e4661bb3abb9576fdd88e7aae.png

百度CTO王海峰认为:“做文心一言不是头脑发热,是十余年的技术积累和产业实践的水到渠成,我们在人工智能四层的技术架构上都有很深的积累,尤其是框架层和模型层联合优化发挥了非常大的作用。”

就像芯片是生长在数学、光电与制造业基础上的。文心一言所代表的大语言模型能力,是生长在AI技术积累,尤其是大模型与深度学习框架之上的。

2019年3月,百度就发布了文心大模型ERNIE 1.0。四年时间,已经从最初的自然语言理解大模型,发展成了跨语言、跨模态、跨任务、跨行业的能力完备的大模型平台。在框架方面,百度早在2016年就正式对外开源PaddlePaddle(飞桨),飞桨有效支撑了大模型的灵活开发、高效训练和推理部署,成为了文心一言诞生的底座。

文心一言另一方面的基础来自于数据和知识,百度在搜索引擎端的庞大数据积累、数据精细化处理,以及知识图谱的搭建,最终成为了文心一言的养料。正所谓你看见的是台上一分钟,看不到的是台下十年功,因为百度预判到了全球AI的预判,每一步都在做正确的事,最终才能实现又快、又好锻造出了文心一言。

如果我们把文心一言背后的技术能力进行打开、分解,就可以清晰看到“水到渠成”是如何实现的。

首先,文心一言就像ChatGPT一样,吸收了大语言模型业界公认的领先实现手段。比如有监督的模型精调,确保模型的高鲁棒性和吸收数据能力;类似人类反馈机制的的强化学习,可以实现模型基于用户反馈持续进化,实现“智能涌动”效果;融合不同类型的数据、知识,构造丰富的提示,生成高质量的结果。

这些能力保证了文心一言能够区别于传统的多轮对话模型,满足用户对新型大语言模型的期待,而百度独特的技术才是文心一言焕发技术创新力的核心。

这个领域的技术,主要包括三个维度:

首先是知识增强。知识增强是文心系列大模型的核心技术特征,也自然而然集成到了文心一言当中。即通过引入知识图谱,“知识增强”的方法,将数据与知识融合,使得文心大模型相较于其他模型,学习效率更高、可解释性更好。在文心一言能够实现“知识增强”的背后,是百度构建了包含5500亿事实的全球最大知识图谱,从这里我们也可以看到文心一言与文心系列大模型紧密的关系与一致的技术序列。百度在大模型领域的积累,最终在文心一言完成了厚积薄发。

其次是检索增强。文心一言并入了百度在搜索引擎方面的能力与技术,百度新一代搜索架构已经发展到了基于语义理解和匹配,其中文心大模型分别理解用户输入和文档,形成双塔模型,然后基于理解进行匹配。这让文心一言可以准确获得高时效性的内容,填补了ChatGPT目前为止还无法实现的空白。同时,检索增强也可以优化大模型的推理能力,使它的回答更加精确、有效。

此外,文心一言还加入了百度长期积累的对话增强能力。从而使得大模型具有上下文理解、多轮对话等能力,增强对话的连贯性、合理性。

全球领先的技术范式,需要我们有能力去学习和了解;自身储备的核心技术能力,则可以在关键时刻构筑差异化。二者结合,中国AI才有出路。文心一言背后的技术序列,为中国AI究竟如何发展点亮了方向。

另一方面,文心一言能够在如此快速的时间内完成训练、部署,最终为中国AI抢得了先机,不得不提到背后的开发基座——飞桨。

在框架层,飞桨是百度自主研发的中国首个开源开放的产业级深度学习平台,包括核心框架、产业级模型库、开发套件、工具组件,以及学习和实训社区,能够标准化、自动化地支撑模型生产和应用。在飞桨的配合下,文心一言才能够有效实现大量最新技术的融合,同时在如此短的时间内完成开发、落地。

从中可以看到,百度已经筑造了飞桨+文心,即深度学习开发平台+大模型的产业路径。二者结合,企业和开发者可以获得从算力、框架、模型库,再到大模型调用、大模型行业化的所有能力,得到了完善、稳固的产业智能化基座。

文心一言精、快、好落地的今天,就是更多中国大模型脱颖而出的明天。

中国故事,刚刚开始

36827461f7529e6de3e003f96b65f41a.png

大语言模型崛起,乃至更宏大的AI复兴与新一轮科技革命,在文心一言的证明下,应该可以说上一句:中国故事,才刚刚开始而已。

我们知道大语言模型的应用化,可以带来非常多的产业发展可能。其中包括但不限于引领搜索、办公、客服、内容创作等领域的变革;为更多未知应用提供底座,甚至形成用户的超级智能助手。而大模型与行业的融合,则可能带来千行百业的生产力革新。

这些产业可能性的基础,必然是中国具备与全球顶尖水平对齐的AI能力,不能留下短板,不能受制于人。

就像AlphaGO的价值不仅在棋盘上,ChatGPT的价值不仅在问答中。文心一言的价值也不仅仅在百度的业务范畴内,不仅仅是满足一次“中国能不能做大语言模型”的好奇——它的价值在更远的地方。

9f37c20c91621335faca044ae2283a06.png

向后看,文心一言证明了百度乃至更多中国AI公司的技术能力。百度是全球为数不多拥有“芯片层、框架层、模型层、应用层”全栈AI技术能力的公司。这些积累究竟能不能打硬仗,能不能实现与世界一流水平的并排抢跑?这些问题在文心一言这里,也就有了答案。

向前看,中国AI究竟是否能攻坚克难,解决关键技术自主化的时代难题等未知的问题,需要一些火苗,一些希望。

或许,文心一言刚诞生时还不完美。这一方面是因为技术还需要发展,模型还需要进化,需要用户的反馈来不断迭代升级;另一方面,是因为我们对它有着过高的期待,对中国科技有着过高的期待,极高预期之下,没有技术是完美的。

不妨给文心一言一些耐心,给中国AI一些时间。难题从来无法马上被解决,但也只有那些足够艰难,需要漫长时间与精力去破解的难题,才有被解决的必要。

好在,中国AI已经踏上了奥林匹亚的赛场。参赛,就是无数可能性的开始,就是话语权的基座。

会在某一天,未来的某一天,我们回首看,是八千里路云和月。

36cef8eea9f01b08bfa4d0dfc9b65174.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/42959.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Google I/O 2023 全球开发者大会 Reveal Event

目录 When is Google I/O 2023? 谷歌 I/O 2023 是什么时候? Is Google I/O in person? 谷歌I/O是亲自吗?

王小川新AI公司浮出水面:成立「五季智能」,召集搜狗旧部,水下估值接近独角兽...

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI 前搜狗CEO王小川的AI新公司,正式浮出水面。 公司名为五季智能。 企查查信息显示,公司股东为王小川和茹立云。 后者是王小川的老朋友,在搜狗创业初期就和王小川合作,并曾任搜狗COO&#xf…

AutoGPT的出现,会让程序员失业吗?

最近,一个叫AutoGPT的模型火了,在GitHub上线数周Star数就直线飙升。截至目前,AutoGPT的Star数已经达到87k,马上接近90k,超过了PyTorch的65k。 根据AutoGPT的命名,就可以发现其神奇之处在于“auto”&#x…

4月11号软件资讯更新合集......

跟 ChatGPT 聊天、需求润色优化,禅道 OpenAI 插件发布! 禅道插件上新了,OpenAI 禅道集成,可提供神奇海螺聊天、需求润色功能。 神奇海螺 “章鱼哥,你为什么不问问神奇海螺呢?”—— 海绵宝宝 那么&…

ChatLaw团队招实习生啦!真格基金的创业、投资与AI详细指南;远程工作的8个安全法则;游戏开发者的数学教程 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 北大 ChatLaw 团队招聘实习生,开放算法和前后端岗位 ChatLaw 是一个开源的中文法律大模型,由北京大学与北大-兔…

实现自动化部署前端项目,从安装Jenkins到部署完成的整体配置 --适合初学Jenkins、想实现或者学习自动化部署的同学,知识点比较全面,过程写的清晰

前言 一、什么是Jenkins 二、Jenkins安装配置 Linux环境安装JDK Linux环境安装Maven Linux安装Jenkins 启动Jenkins jenkins配置 配置汉化版的jenkins 安装gitHub插件 gitHub配置 jenkins的配置 jenkins的gitHub配置 jenkins的java环境配置 小总结 两种情况 第…

顶级数学家玩股票胜过巴菲特 被人建议改行(图)

曾获得世界数学界最高荣誉的西蒙斯,转做投资以后,比巴菲特做得还好 国庆长假之后,中国股民惊喜地发现,股市仿佛重新被唤醒一般,短短几日,股指势如破竹,数次高开高走。股市又开始火了&#xff0c…

【量化】用数据验证巴菲特推荐的指数定投的收益真相

作者:幻好 来源: 恒生LIGHT云社区 最近几年,越来越多的年轻人开始接触基金,购买基金定投理财,本文将通过数据验证指数定投是否真的有效。 背景简述 1993年巴菲特在《致投资者的信》中首次提到了他的建议&#xf…

评温斯坦的炒股书(非常重要,常看看)

http://blog.sina.com.cn/s/blog_674caeca0101dlgq.html 技术分析的经典书籍,就我个人的观点而言,技术分析书籍多数是浪费时间和误人子弟的,纯粹技术分析的书籍不可多读。但我现在要强烈推荐一本技术分析的经典书籍:《史丹温斯坦称…

股神巴菲特

股神巴菲特:5岁开始做生意,11岁开始炒股 沃伦巴菲特1930年出生在美国西部一个叫做奥马哈的小城。他出生的时候,正是家里最困难的几年。父亲霍华德巴菲特投资股票血本无归,家里生活非常拮据,为了省下一点咖啡钱&#xf…

四个参数秒懂巴菲特价值投资

目录 1 巴菲特价值投资三规则... 1 2 四项参数指标对应三条规则... 1 3 价值投资选股软件... 2 1 巴菲特价值投资三规则 要说炒股,那必须得说说炒股界的扛把子巴菲特,他的选股理论是价值投资。价值投资属于长期投资策略。价值投资理论是用一个便宜的…

Android 仿微信群聊组合头像

转载:http://blog.csdn.net/tiantianshangcha/article/details/9836809 大概原理是先设想一个要合成的图片的大小,然后根据要合成的图片的个数以及要展示的位置进行计算,生成坐标系的配置。 然后利用android的绘图把要合成的头像根据坐标系&a…

仿微信通过拍照、本地图片然后裁剪完美更换头像

其实更换头像这个功能是个老梗了,写的人也很多,但是我没有看见过特别让我满意的,没办法,只能自己搞了。这里面我只说难点吧,最后的会附上完整的代码。 这里面涉及到的功能有哪些呢? 大概有:拍…

android微信群聊功能,Android仿微信群聊头像效果

在网上找了些仿微信群聊头像的开源库后,发现没特别好用的,或者说满足我需求的,就只好在别人的基础上改了下,也就有了这样的自定义控件了,以此来实现微信群聊头像的效果,效果图如下所示: 主要实现…

android高仿微信UI点击头像显示大图片效果

用过微信的朋友朋友都见过微信中点击对方头像显示会加载大图,先贴两张图片说明下: 这种UI效果对用户的体验不错,今天突然有了灵感,试着去实现,结果就出来了。。 下面说说我的思路: 1.点击图片时跳转到另一…

Android高仿微信头像裁剪

最近公司的APP很多用户反应无法上传头像,于是打算修改原来头像裁剪的代码。参考微信、QQ、唱吧头像裁剪的操作,决定就仿微信头像裁剪来上传用户头像,在Android大神鸿洋的一篇高仿微信头像的博客(博客地址结尾会贴出来)的基础上加了一些代码&a…

Android仿微信群聊头像合成

最近碰见仿照微信头像的需求,提供多个url的组合头像,做成微信群聊一样的头像,网上查了下,有两类,一种是合成的,一种是多个view合并展示的,合成的做的感觉很简陋,不太满足需求&#x…

android 仿微信群聊头像 合成图片

android 仿微信群聊头像 合成图片,微信中可以显示出群头像为多个用户的头像网格,这里讲方法已经封装好, 如果有记得点赞哦!! 先看效果: 使用例子: Override public void onClick(View v) {P…

Android 仿QQ讨论组头像

一、效果图 二、实现 基本实现过程&#xff1a; 1.将原图片读取为bitmap 2.在Canvas画布上计算出图片位置&#xff0c;并绘制新的图片。 &#xff08;ps:计算位置对我来说是难点&#xff0c;花了好长时间&#xff09;&#xff1b; 三、源码 1.布局文件 <?xml version…