文心一言,甩开GPT-3.5,与GPT-4掰手腕?

文|智能相对论

作者| 叶远风

“请写一个肯德基疯狂星期四的段子。”

“我女朋友的老公应该叫我什么?”

“XX微信群的群主与吴彦祖谁更帅?”

......

给几个搞怪的问题,戏耍一下,把答案贴出来,大家嘲讽一番。

在文心一言发布后,这种玩法直到今天还没有停止的意思。

可能连背后的技术与产品人员都没有想到,文心一言会以这样的方式火了下去。

作为国产版ChatGPT,文心一言在发布后,除了赞誉的声音,以各种形式被批判应该在意料之中,ChatGPT当初也是如此,这是产品不断进化要经历的过程。

只不过,在没有好坏的定论中,到底要给文心一言当下的技术水准定一个什么样的定义,并没有客观的、更加令人信服的结论。

起码,这种“戏耍”并不能反映多模态大模型所具备的能力。

ChatBOT固然可以闲聊,也应该支持用户随便闲聊,但闲聊互动不应该成为一款专业产品能力的最终评价标准。

光怪陆离的问题,就算去询问一个人类智者,得到的答案也是光怪陆离的。

现在来看,以某种更现实的视角去提出问题、实测答案,才更能体现出文心一言的能力和价值。

这种现实的视角应当有很多,其中,以企业信息需求为着眼点,会是其中之一。

这是因为,从文心系列大模型走向对话产品“一言”,或者,从GPT-3.5到GPT-4,ChatBOT最后都还是要走向商用、服务企业,创造专业价值的。

GPT-4发布后并没有公布其参数量,这被认为是走向商业化的准备,毕竟OpenAI制定的数亿美元营收目标现在快到4月份了还没太大动静。

而服务企业,要么提供“生产力”价值,这是ChatBOT场景垂直化后需要探索的内容,在各产业提供具体的工作能力;要么提供信息价值,通过类似“上帝之眼”的信息整合与逻辑梳理能力,帮助企业消除信息不对称,获取需要的信息。

目前ChatBOT的产业应用还未见,因此信息价值就成为可以客观评价的维度。

“智能相对论”团队获得了文心一言的内测账号,以及ChatGPT普通版本(基于GPT-3.5)与plus版本(基于GPT-4)的测试资格,尝试从企业信息获取维度,提出六个关联问题,从各答案中对比出文心一言的实际能力。

总体上,文心一言甩开GPT-3.5不成问题,与GPT-4能够掰手腕做到有来有回。

具体一个个分析,每个问题下,分别是文心一言、ChatGPT普通版、ChatGPT plus版的回答截图。

01、企业数字转型怎么找外部合作伙伴,现在有哪些类型的伙伴可以选择?

可以看出,在三个回答中,只有文心一言提到了选择外部合作伙伴要注意到的几点,然后再例举可以找哪些类型的合作伙伴。

而ChatGPT普F通版、ChatGPT plus版都只是直接给出了类型。

这显示出,文心一言在算法上,相较与其他两个产品,对问题的潜在需求认识可能更加深刻。

02、企业应该怎样抓住新的市场机遇

在这个问题的回答中,很显然,条目的多少,基本上决定了答案的质量。

对一个企业来说,要抓住市场机遇,就应该要找到更多的方法,考验的是ChatBOT整合信息并分门别类的能力。

在这里,文心一言超越GPT-3.5但略逊于GPT-4。

03、企业怎么招徕优质人才,有哪些好用的渠道?

与上一个问题类似,条目的多少直观反映了chatBOT解决需求的能力。

文心一言远超GPT-3.5,并超越了GPT-4,再一次掰赢了手腕。

04、员工的工作效率很低,怎么办?

这一局,相似的判断标准,文心一言继续领先GPT-3.5,但没有打赢GPT-4。

05、客户总是不回款,有什么好的办法?

这个问题,由于各个回答都涉及了可能破坏企业与客户关系的行动,因此都进行了一次“打补丁”式的追问。

基本上,三个模型都很好地领会到了追问的意图,对“不和客户关系搞僵”有准确的认知,并提供了对应的答案。

其中GPT-4的表现超越文心一言。(注意ChatGPT有字数限制,plus版限制在700字左右,所以其输出因为字数太多最后被中止)

06、企业资金链紧张,但是银行不肯借钱,怎么办?

吸取上个问题的教训,这个问题直接把限制条件加入到问题当中。

类似上一个问题,三个模型对“银行不借钱”情形下企业资金链紧张的应对办法都有清晰的认知,规避了银行信贷这一种方式。

其中,文心一言与GPT-4打成了平手,都提供了相同数量的方法供企业选择。

总结以上,仅就这六个企业比较关心的专业问题而言,文心一言全面胜过GPT-3.5,对GPT-4两胜、两负一平,典型的你来我往掰手腕。

而更进一步看,实际上在回答条目上的胜负,无关算法本身的设计,在技术上与算法训练的数据量和训练时长有关(要给足够多的食物,也要给足够多的时间去吃食物),后续的竞逐将仍然在数据训练上。

对文心一言而言,发布更晚已经吃了亏,下一步如何在训练上追赶、赶超(可能意味着巨大的成本投入)是百度要考虑的问题。

当然,由于文心系列大模型过去早已具备了丰富的多模态能力,因此文心一言在发布时就自带有GPT进化到“4代”才加入的多模态能力,这一点也常常为业界所忽略。

而“智能相对论”认为,未来ChatBOT的比拼,将很大程度上在多模态展开。

这意味着,当下的文本竞逐,只是一切的开始。

现在,任何的结论,不管是褒扬的还是贬低的,可能都为时尚早。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10035.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT显示付费墙内容,OpenAI把联网功能关了

ChatGPT 学会上网不到两个月,OpenAI就不能忍了。 本周二,OpenAI 突然宣布停止 ChatGPT 的网络浏览功能「使用 Bing 浏览」。 果不其然,关闭的原因是这项功能遭到了滥用。在周一发布的一篇文章中,OpenAI 支持团队人员表示&#xf…

ABC267G Increasing K Times 题解

做这道题,很有感悟,发篇文。 先给数列从小到大排个序。 接下来设 f i , j f_{i,j} fi,j​ 表示前 i i i 个数的排列形成 j j j 个上坡的方案数。 接下来考虑转移,分为插入第 i i i 个数后增加上坡和不增加上坡两种情况。 对于不增加的…

上海亚商投顾:两市成交创年内新高 人工智能再爆发

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 三大指数今日高开高走,沪指震荡反弹逼近3300点,创业板指午后涨超1.7%,科创50指…

《领航优配》暴涨200%牛股,突然闪崩跌停!

今天早盘,A股全体低开高走微幅震荡,主要股指涨跌互现。 盘面上,知识产权、传媒娱乐、网络游戏、医药等板块涨幅居前,半导体、芯片、家用电器、工业母机等板块跌幅居前。北上资金净流出14.71亿元。 上海电影盘中跳水触及跌停&…

九龙证券|三胎概念股拉升…港股跳水,恒生科指重挫近5%

兔年首个交易日,A股迎来开门红,沪指开盘即打破3300点,创业板指一度涨近3%;港股却大幅下挫,恒生科技指数一度跌超5%。 详细来看,A股方面,两市股指全线高开,沪指开盘即打破3300点&…

港联证券|沪指高开低走跌0.16%,3只注册制主板新股涨翻倍

10日,三大指数团体高开,盘中全线下行翻绿,深成指领跌,A股迎来全面注册制,主板注册制第一批10只新股全线飙升,多股盘中触发临停。 上证指数跌0.16%,报3322.17点。深证成指跌0.70%,报1…

【转发+修正】【人工智能】验证码识别(代码)-- 附上训练好的模型

转发博客:[深度学习]验证码识别(代码) ps:原文中有链接提供了github上的项目代码,但是有一点点小问题(我在原文评论中已经指出),另外我附上已经训练好的模型(直接运行验证码测试.py** 就可以预测…

【NLP】自然语言处理的中间序列建模

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

自然语言处理 基于预训练模型的方法 代码解读 [ section 4.1.6, page 77 ]

自然语言处理 基于预训练模型的方法 代码解读 [ section 4.1.6, page 77 ] 自定义神经网络模型的例子:一个简单的多层感知器模型MLP 文件名为 mlp.py # Defined in Section 4.1.6 # Page 77 # 自定义神经网络模型的第一个例子(The first example of c…

自然语言处理(基于预训练模型)02NLTK工具集

NLTK是对英文文本数据进行处理的常用工具 1 停用词 1.1 查看停用词 import nltk nltk.download(stopwords) from nltk.corpus import stopwords print(stopwords.words(english)) 2 常用语料库 2.1 未标注语料库 2.1.1 找出古腾堡语料库中的emma原文 gutenberg下载地址&am…

【NLP】介绍几个语言生成的预训练模型

作者 | Chilia 哥伦比亚大学 nlp搜索推荐 整理 | NewBeeNLP 大家好,这里是NewBeeNLP。本篇介绍四个为语言生成设计的预训练模型 -- BART,MASS,PEGASUS,UniLM。其中前三种方法都使用了Transformer Encoder-Dec…

使用ChatGPT+Xmind一键生成思维导图,简直泰裤辣

📋 个人简介 💖 作者简介:大家好,我是阿牛,全栈领域优质创作者。😜📝 个人主页:馆主阿牛🔥🎉 支持我:点赞👍收藏⭐️留言&#x1f4d…

【使用心得】最新版ChatGPT查资料

最新版ChatGPT是一款非常实用的软件,它提供了广泛的辅助工具,可帮助我在各个领域提升工作效率。使用体验更加流畅,界面也相对更加美观。 首先,最新版ChatGPT加强了语言翻译功能,并进一步完善了交互方式,使…

ChatGPT4和低代码来临,程序员面临下岗?

一个网友吐槽道: “ 建站出来了,你们说程序员会失业。 低代码出来了,你们说程序员会失业。 Copilot出来了,你们说程序员会失业。 Chatgpt出来了,你们说程序员会失业 虽然这只是网友的吐槽,但却引起了小编…

ChatGPT时代的得意忘言

David S. Soriano, CC BY-SA 4.0 via Wikimedia Commons 导读: 以ChatGPT为代表的新的人工智能语言模型,具有划时代的意义。一个值得思考的问题是,人工智能具备的测算能力,无法完全等同于人类的判断力。 在《测算与判断&#xff1…

ChatGPT提示词工程进阶教学

ChatGPT提示词工程 1 两种大型语言模型LLM1.1 基础大模型(base LLM)1.2 指令调优大模型(Instruction Tuned LLM) 2 如何更清晰、具体地书写提示词2.1 在提示词中使用“定界符”2.2 向模型请求结构化的输出2.3 要求模型检查任务条件是否满足2.4 输入多范例…

【花雕学AI】ChatGPT的四大语言处理神器:文本生成、问答、创意生成和内容优化的技巧和实例

引言:ChatGPT是一个人工智能聊天机器人,它可以理解和交流多种语言,例如中文、英文、日文、西班牙语、法语、德语等。它是由OpenAI开发的,基于GPT-3.5和GPT-4这两个大型语言模型。它不仅可以与用户进行对话,还可以根据用…

chatgpt赋能python:Python文本清洗:从混乱到整洁

Python 文本清洗:从混乱到整洁 如果你曾经在处理文本数据时花费了大量时间将信息从混乱的文本中取出来,那么你应该考虑使用 Python 进行文本清洗。Python 是一种易于学习和使用的编程语言,可用于自动化文本清洗流程,实现高效准确…

难逃 AI 的法眼:ChatGPT 文本检测器(ERNIE 文本分类)

★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>> 参考项目地址:https://github.com/Hello-SimpleAI/chatgpt-comparison-detection 本项目 Demo 地址:https://aistudio.baidu.com/aistudio/projectdetail…

chatgpt赋能python:Python对文本进行分词

Python对文本进行分词 在自然语言处理(NLP)领域中,对文本进行分词是一个重要的预处理步骤。分词的目的是将一段文本切割成由词语组成的序列,为后续的处理提供基础。 Python在NLP任务中是广泛使用的编程语言之一,有许…