文心一言 vs ChatGPT!相同 10 问,结果出乎意料

74841b6cddf94d0270f509bba789ef13.gif

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

昨日百度「文心一言」的发布,无疑成为了国内科技圈关注的焦点。不少人看完发布会之后,第一反应就是:求邀请码! 

幸运的是,CSDN 编辑团队是「文心一言」首批内测用户之一。 

既然可以第一时间体验这款“国产版 ChatGPT”,我们自然也满足广大读者粉丝的好奇心:同样的问题,「文心一言」 vs ChatGPT,二者究竟谁更胜一筹? 

考虑到「文心一言」的“炸场” Demo 即围绕文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成这五个角度,因此接下来我们也将从同样的维度将其与 ChatGPT 进行对比评测。

68bf17bb4e3e7497640c26cede6a924d.jpeg

3e3a3c7975099fcc84640bb9b3cf6271.png

文学创作

提问:龟兔赛跑的结局是什么?如果要续写这个故事,可以有哪些角度? 

  • 「文心一言」的回答:

8788c509d243bf4acf6bafae7049939d.png

  • ChatGPT 的回答:

3cd9ee0b4d2a6a6b03eebd91d572b487.png

从结果可以看出,「文心一言」和 ChatGPT 都进行了正确回答,不同之处在于「文心一言」对故事整体概述了一遍,解释了乌龟赢得比赛的原因。在故事的续写上,二者给出的角度也不分伯仲,而「文心一言」更是对每个续写角度都给出了相应的寓意解释。

整体而言,在这个问题中「文心一言」和 ChatGPT 不相上下,「文心一言」以更全面的回答略胜一筹。

c4de5ac83c860585acfe66dc3dc56cc2.png

商业文案创作

提问:帮我开发的智能扫地机器人起个名字,再写一篇600字左右的商业宣传文案,用于推广这款产品。

  • 「文心一言」的回答:

d35de5b50e98acf4fa1acbd8edcb3307.png

  • ChatGPT 的回答:

c085e51e2072542afd3561abe8f00563.png

这个提问包含了两个要求:一是为扫地机器人起个名字,二是写一篇宣传稿——ChatGPT 没有漏题,给出了“智扫”这个名字;而「文心一言」没有回答第一个问题,或者它可能误解成了要为宣传稿起标题。 

再看各自生成的宣传稿,「文心一言」的文章篇幅是 413 个字,ChatGPT 则是 545 个字,对于“600 字左右”的要求,ChatGPT 更为接近。至于文案内容,二者写得都不错。

综上,在这个问题中,相比 ChatGPT,「文心一言」的表现还需要再进步一些。

051808c083b73e4eefd39ce8b6c912ce.png

数理逻辑推算

提问:某厂一车间有64人,二车间有56人.现因工作需要,要求第一车间人数是第二车间人数的一半.问需从第一车间调多少人到第二车间?(列方程解答)

  • 「文心一言」的回答:

c8ef50c6ecd382c7b599672534f32457.png

  • ChatGPT 的回答:

721f127e17b4489269a286fb8210e9d6.png

这道应用题源自初中数学题库,是一元一次方程常考的题型之一。从生成结果来看,ChatGPT 给出了正确答案并附有详细解题步骤,而「文心一言」可能在题意理解上还有待改善。

就这道题而言,得出正确答案的 ChatGPT 比「文心一言」表现得更好。 

bb2ffe5af4e92cdc58a0f9526585e295.png

中文理解

提问:京剧中的生、 旦 、净、丑分别指什么? 

  • 「文心一言」的回答:

e03dfabac2eed66cd6a62a99a98eef99.png

  • ChatGPT 的回答:

334149db5600212f41494b00b36a14d2.png

百度称「文心一言」具备中文领域最先进的自然语言处理能力,从它对京剧生、 旦 、净、丑的理解来看,水平还不错,还多回答了一个题目中没问的“末”。ChatGPT 的回答乍看之下也挺好,但细看之后,净行居然要“跳高、走钢丝”? 

对于中国文化特有的词汇,相较于 ChatGPT,「文心一言」在这方面要更准确一些。 

e9c994ed890a102761953a54caf68292.png

多模态生成

提问:帮我画一只可爱的黄色大猫

  • 「文心一言」的回答:

b2ae65b8d094559cad0ed24ffb4770ca.png

由于目前 ChatGPT 没有直接生成图片的功能,因此只有「文心一言」成功生成了上面的图片,整体来看效果还不错。不过,ChatGPT 有了 GPT-4 的加持后,也可以根据草图生成一个网站。所以总体来说,二者也算是各有千秋。

0b11457bb2b3e0bebf0e995e3074ea8c.png

附加题:编写代码

提问:请写一个使用逻辑回归模型判断用户更喜欢文心一言还是chatGPT的训练代码

  • 「文心一言」的回答:

c0b88fcfb101fcaf7ec69af791c062c8.png

  • ChatGPT 的回答:

01c21c67a30f31d0e24704d0fbbf9a64.png

对于这个编码问题,我们邀请了专业程序员对二者生成的代码进行分析:

1. ChatGPT 准确生成了逻辑回归模型模版代码,解决的是目标问题。
2. 「文心一言」虽然生成了代码,但是生成的是图深度优先搜索(Deep First Search)代码,并不是目标问题解法代码。

正如百度在发布会上所说,「文心一言」的代码能力还需加强,而 ChatGPT 以擅长编码“出圈”果然不无道理。

ba6f067c7265f3036d6be2261db63cce.png

最后,再闲聊一会儿

提问:给我讲个笑话吧

  • 「文心一言」的回答:

adb285facef0bc7f3bafe71de5d1368a.png

  • ChatGPT 的回答:

01d456894f1e37ece312291e318f6efd.png

……怎么说呢,「文心一言」和 ChatGPT 可能都不擅长讲笑话,都不是很好笑。

提问:我有点饿,请你推荐一道成本低于 30 元(人民币)的菜及其做法?

  • 「文心一言」的回答:

7f3cc616a249092d83d8a0ff771293a0.png

  • ChatGPT 的回答:

4fb66a66d131dd35f192290dd365d799.png

「文心一言」推荐了三道菜,ChatGPT 则将做菜步骤进行了详细分解,那么你更喜欢谁的回答呢? 

提问:你的出现会对程序员产生什么影响?是否会取代一部分程序员? 

  • 「文心一言」的回答:

c028b8f6b802282452dc2f684a626a8a.png

  • ChatGPT 的回答:

f6b46e3bc675093c71d88eb3c3d0e750.png

在这个问题中,虽然「文心一言」没有回答“是否会取代一部分程序员”,但它对程序员的影响分析得较为全面;ChatGPT 明确回答了“不会取代程序员”,对程序员的影响也进行了简要说明。

提问:你认为,你和ChatGPT/「文心一言」谁更厉害?

  • 「文心一言」的回答:

ffdfeab6210f676bfb8c3e4fd4776ad4.png

  • ChatGPT 的回答:

78841512b3ce00ddfab736b0b895e748.png

在这个问题上,ChatGPT 和「文心一言」很有默契,表现得都很谦逊。

d3002f699fee04dab8377951a840565a.png

一起慢慢见证「文心一言」的成长

通过本次测试的 10 道问题,可以看出虽然「文心一言」和 ChatGPT 之间还有一定差距,但并没有部分网友唱衰得那么夸张,总体表现还是值得鼓励的。

正如百度 CEO 李彦宏所说:“「文心一言」并不完美,可一旦有了真实的人类反馈,「文心一言」的进步速度会非常快,我们都希望它能快点成长。”也正如昨日巨头财经《不笑百度一小步》中所说:“没有谁能一口吃个胖子,每一个行业每一个类目,都是在点滴间缩小差距。”

出道即封神的 ChatGPT 固然值得称赞,但慢慢见证「文心一言」的成长,或许也不失为另一种幸运和感动。

参考链接:

https://chat.openai.com/chat

https://yiyan.baidu.com/

172c098e14c739fc3324a266bb8b529f.gif

29c8e7117571fc034aa95df7a15c1237.jpeg

 

4bec9e26353c71b128d240da9afe49b4.gif

☞微软 Office 全家桶被 GPT-4 革新:Word 一键变成 PPT,打工人的春天来了!
☞文心一言来了!李彦宏:百度是全球大厂中第一个做出来的!
☞Google 工程主管:AIGC 将在三年内终结编程!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9250.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

12款适合小团队协作、任务管理和进度跟踪的在线任务管理的工具推荐?

国内外12款主流任务管理软件测评: 1.开发任务管理PingCode; 2.多合一项目任务管理Worktile;3.个人和小团队项目任务管理Notion; 4.企业任务管理平台SmartTask; 5.小团队任务管理Teambition;6.IT任务追踪管理Jira等。 无论是做好工作任务管理还是个人任务管理,从来都…

项目计划管理软件:GanttProject

GanttProject是一款免费的项目计划管理软件。 可以导入Microsoft Project的文件,也可以导出。还可以生成jpg图片等的。 对于简单的项目管理来说感觉够用了。最大的好处就是不要钱。呵呵! Gantt chart. Create work breakdown structure, draw dependencies, defi…

如何用Excel制作工作计划,跟踪任务进度,快来学习吧

点赞再看,养成习惯;愚人千虑。必有一得。 微信搜索【亦心Excel】关注这个不一样的自媒体人。 本文 GitHub https://github.com/hugogoos/Excel 已收录,包含Excel系统学习指南系列文章,以及各种Excel资料。 不知你平时上班是否做工…

工作计划进度甘特图.xlsx

作为一名新媒体运营者,与数据打交道可以说是家常便饭。 在工作中,我经常需要对项目进度进行追踪,而在项目追踪中,我常用甘特图来进行追踪,以此来更好的展现工作完成情况的进度。 工作中,如果你列出这样的项…

chatgpt赋能python:Python如何查看地址

Python如何查看地址 在使用Python过程中,常常需要查看变量或者对象的地址以便进行调试和优化。本文将介绍如何在Python中查看地址的方法,并提供一些相关的使用技巧和注意点。 什么是地址 在计算机中,每个变量都会被分配一个(或…

chatGPT引领人工智能第四次浪潮来袭?

第一次人工智能浪潮 第一次人工智能浪潮在1956年,当时在人工智能研讨会上,约翰.麦卡锡提出了“人工智能”的概念,这被认为是人工智能的起源,于是约翰.麦卡锡被称为人工智能之父。 这个阶段产生了很多理论基石,这些不仅成为了人工智能的理论基石,还成为了计算机领域的基…

用 SwiftUI 实现 AI 聊天对话 app - iChatGPT

一、前言 关于 ChatGPT 的话题,大家都不陌生,我们直入话题,因为 ChatGPT 目前限制中国访问服务,所以如果直接使用 ChatGPT 网页进行对话,还是不太方便。通过 ChatGPT SessionToken 就可以不限制网络访问,所…

追赶ChatGPT,我们的差距在哪里?

又一家中国互联网巨头在追赶ChatGPT了。 3月底举行的博鳌亚洲论坛上,腾讯集团高级执行副总裁汤道生披露,腾讯正在研发AIGC以及大模型相关技术,类ChatGPT的对话机器人也在酝酿中。 百度、华为,如今再加上腾讯,ChatGPT出…

AI绘图新玩法「艺术风二维码」保姆级教程分享,注册账号就能玩,一分钟出图,定制自己的二维码!

部分图片有问题…可以看看这里。 大家好,我是卷了又没卷,薛定谔的卷的AI算法工程师「陈城南」~ 担任某大厂的算法工程师,带来最新的前沿AI知识和工具,包括AI相关技术、ChatGPT、AI绘图等,欢迎大家交流~。 最近AI绘图…

强力推荐:ChatGPT指令大全指南

担任记者 我想让你做一名记者。您将报道突发新闻,撰写专题报道和评论文章,开发用于验证信息和发现来源的研究技术,遵守新闻道德,并以您自己独特的风格提供准确的报道。我的第一个建议请求是“我需要帮助写一篇关于世界主要城市空气…

谈谈我对证券公司一些部门的理解——前、中、后台(转)

导语:起底金融界从业的主流选择。 作者 | cnfake 来源 | 经管之家(原人大经济论坛) 已经是2013年6月的一篇文章了,作者在文中对证券公司前中后台的各个部门的业务与职能,未来发展前景等方面进行了分析,笔者…

ChatGPT告诉你:项目管理能干到60岁吗?

早上好,我是老原。 这段时间最火的莫过于ChatGPT,从文章创作到论文写作,甚至编程序,简直厉害的不要不要的。 本以为过几天热度就自然消退了,结果是愈演愈烈,热度未减…… 大家也从一开始得玩乐心态&#xf…

微软将更新Bing整合更快速版本的ChatGPT

根据Semafor 报导,微软正致力于将OpenAI 的ChatGPT 的更快版本,引进Bing 搜索引擎,以此作为与Google 竞争的工具。知情人向Semafor 透露,ChatGPT 和GPT-4 之间的主要区别在于速度。虽然ChatGPT 有时需要几分钟才能产生回应&#x…

邮件客户端用IMAP还是POP3,为什么?Thunderbird 雷鸟和免费腾讯企业邮箱

从2023年4月1日起腾讯企业邮箱免费版的容量从2G降到1G,网易企业邮箱免费版也只有1G,所以现实的问题是如何把目前服务器上的所有邮件下载下来? 很久很久以前当网速很慢上网费很贵的时候一直使用POP3协议,这样可以Offline写邮件查邮…

通过预设ChatGPT指令让博弈Ai为你轻松的工作

链接:博弈Ai-基于ChatGPT4及3.5的智能聊天机器人国产镜像博弈Ai是一款基于OpenAI公司的ChatGPT4.0和3.5接口开发的国产镜像官网,可以对话、聆听、学习和挑战的自然语言生成式人工智能Ai聊天机器人,同时接入百度文心一言、阿里通义千问、华为盘…

ChatGPT API 低价上线,开发者可以人手一个了?

千呼万唤,ChatGPT API来了! 不仅首发,价格居然还有惊喜,0.002美元/每1000 token,并将价格降低90%,直接打了1折。OpenAI官方还表示,gpt-3.5-turbo目前的版本代号是gpt-3.5-turbo-0301&#xff0…

ChatGPT 是怎样炼成的?

原本链接:https://mp.weixin.qq.com/s/R8EwUppkQg4igal_5h6E0Q 一、前言 2022 年 11 月,OpenAI 发布了大规模语言模型的又一力作:ChatGPT,瞬间引爆学术界和舆论场,有人用它编写贺词发送祝福,有人用它吟诗…

多云时代,下一代数据管理箭在弦上

“云服务提供商仅保护基础架构,客户负责保护自己的应用程序和数据。”这是很多云服务商都会遵从的云安全责任共担模型的一条基本原则。但实际上,只有3%的中国受访者知晓这一模式并认为上述说法是正确的。Veritas发布的《2022守护企业多云环境》研究报告的…

大模型生态和产业链分析,拆解OpenAI 的愿景和技术底层

本文从 OpenAI 的 AGI 愿景出发,对基于大模型的生态和产业链的发展给出了自己的分析并提出了一些供大家思考的问题。希能够对国内正在从事大模型研究、开发、投资的工作者们带来帮助。 社群讨论: ​ 原报告内容已"开源"并在持续更新中&#xf…

使用 Azure OpenAI 创建一个聊天机器人

由于众所周知的原因,国内是没法直接调用 OpenAI 接口的。幸好可以白嫖 Cloudfare Workers、Vercel 等免费服务做 API 代理,我之前一直是这么用的,速度也还可以。 前两天申请的微软的 Azure OpenAI 接口通过了,立即体验了一下。它的…