ChatGPT最强对手,实测却输给了文心一言!

侵犯版权、隐私、遭遇轮番起诉,ChatGPT访问量直线下降,市场竞争力暴跌!

就在此时,Open AI的最强竞争对手Anthropic趁虚而入,推出Claude 2,杀它个措手不及。一批网友抢先体验过后,铺天盖地一片好评。

据悉,Claude系列刚被推出时就被给予厚望,由于创始团队都在Open AI任职过,技术过硬,呈现出的效果相当完美,意图理解也非常优秀。而且还推出了Claude Chat网页版,完全免费!

在性能方面,Claude 2正式支持10万tokens的输入,并且可以一次性输出4000个tokens。

此外,由于使用了2023年的数据训练模型,Claude 2“了解时事”,输出内容更具时效性。这些性能的改进都大大提升了Claude 2在用户心目中的分量。

 Anthropic官网上描述说:“我们很高兴发布Claude 2新模型,不仅改进了性能,还延长了响应时间,可通过API及面向公众的测试版网站Claude.ai进行访问。”

1、性能提升:文理通吃、为安全保驾护航

相较ChatGPT,Claude 2有如下优势:

首先是token:GPT-4的下限默认为8k个token,上限32k个token,而Claude 2是100k个token,与GPT-4根本不是一个量级!

然后是费用,GPT-4每月支付20美元,而Claude 2是完全免费的!

由于Claude 2具有更长的token,长文本处理能力更强,在文科方面发挥出了优势。

在美国律师资格考试的多选题部分可以取得76.5%的正确率,前代Claude 1.3仅为70%。在GRE阅读和写作测试中,得分超过90%应届毕业生。而在美国医师执照考试中,Claude 2在3个科目中的分数都超过了60%,获得ALL PASS佳绩。

不仅如此,Claude 2还文理通吃,在编程、数学和推理方面准确率大大提升。

在迭代的过程中,Claude 2的安全性变得更强、受模型的约束,很难产生具有攻击性或危险的输出。研发团队内部特设评估团队,针对大量有害提示对模型评分和自动化测试。团队也会定期亲自上手检查结果,确保万无一失!

结果表明,在整个评估环节中,Claude 2在给出无害反馈方面比Claude 1.3强2倍。

鉴于安全、功能及性能有所提升,Anthropic宣布Claude 2在美国及英国开放全面公测,他们也计划未来几个月内再扩大测试对象。

2、生态强:多领域、跨学科合作

Anthropic的理念是多领域、跨学科合作,与数千家使用Claude API的企业建立了合作关系。

其中之一是AIGC独角兽公司Jasper。Claude 2能够在各种用例中与其它最先进模型齐头并进,在长时间、低延迟使用方面具有特别的优势,为客户生成独具创意的广告文案内容。

Jasper工程副总裁Greg Larson表示:“我们很高兴能够成为首批向客户提供Claude 2的公司之一。它增强了语义、带来最新知识培训、能够对复杂提示进行推理改进。”

Sourcegraph是AI代码平台,可帮助客户编写、修复和维护代码。编码助手Cody使用Claude 2改进的推理能力为客户提供更准确答案,同时,还通过token高达100K的上下文窗口传递更多代码库。此外,Claude 2的训练数据更新,可获取新框架和库的知识。

Juni Learning是在线教育解决方案的领先提供商,使用Anthropic为其Discord Juni Tutor Bot提供支持,帮助学生完成学业。

3、Open AI内忧外患,挑战者的好时机

近日,据外媒报道称,OpenAI的核心员工正在流失到谷歌。其中一些员工已经辞职并与谷歌签订了合同,另外一部分人也将在近期离开OpenAI。

虽然此次核心员工离职潮看起来是OpenAI爆炸式增长引发的一系列管理问题,但深究其本质原因,或许是员工对CEO管理的不满以及对ChatGPT技术举步不前的失望造成的。

凭借着微软100亿美元的资金,OpenAI似乎满足于追逐他们最大的摇钱树 ChatGPT,但对于ChatGPT进一步开发计划却迟迟没有下文。如此看来,3月份亮相的Claude正朝初心方向发展,而ChatGPT却中途停滞。

不仅是内忧、外患也一并袭来。马斯克虎视眈眈,又有大动作!其旗下又一家公司问世!当地时间7月12日,马斯克在推特上宣布:人工智能公司——xAI正式成立。

图片

xAI的官网已上线。据介绍,该公司由马斯克本人亲自带队,而其他成员则来自DeepMind、OpenAI、谷歌研究院、微软研究院、特斯拉、多伦多大学等,曾参与过DeepMind的AlphaCode和OpenAI的GPT-3.5和GPT-4聊天机器人等项目。

从成员组成看,如此高端,马斯克或将xAI定位为与OpenAI、Google和Anthropic等公司同台竞技,他们多是知名聊天机器人的推手。

xAI公司号称宗旨是“了解宇宙的真实本质”。7月14日,该公司团队将在推特空间举行发布会,进一步解答网友的问题。

4、版本评测

官网消息显示,今年3月,Claude被正式推出,当时发布了两个版本,即,Claude1.3和Claude Instant1.1,各司其职、特性各异。

在基本的评测中,研究者也比较了三个版本。数据证明,新版本功能提升极大,主要表现在如下方面:

图片

如上表所示,在Python函数合成(Codex P)、GSM8k(小学数学问题)、MMLU(多学科问答)、QuALITY(长故事问答测试)、ARC-Challenge(科学问题)、TriviaQA(阅读理解)和RACE-H(高中阅读理解和推理)上,Claude 2的大部分得分都更高了。

图片

官网上也透露说:“Claude具有高性能,而Claude Instant更便宜、更快。”

5、鸡兔同笼,输给了文心一言

为实测Claude 2的能力,我们尝试用“鸡兔同笼”问题测试文心一言和Claude 2,并进行了对比。

图片

如图所示,Claude 2的中英文都输出了错误的答案...

图片

而用文心一言进行测试,竟然算对了,看来还是文心一言靠谱!

图片

图片

有趣的是,ChatGPT中文版算对而英文版算错了!实测有点打脸!看来,Claude 2数学能力提升任重而道远。

6、用户:Claude比ChatGPT更健谈

再来看看用户反馈如何,Claude生成的对话文字似乎比ChatGPT更灵活!

“Claude比ChatGPT更健谈,在讲故事时更具互动性和创造性。”一位用户留言说。

“我个人喜欢Claude的答案呈现方式,深入而简单,”一位用户评价说,他对Claude的语言技能和专业知识问答印象深刻。

图片

主要合作伙伴之一Quora通过AI聊天工具Poe也向用户展示了Claude。“用户普遍认为Claude的回答详细且易于理解,交流时感觉像普通交流对话,”Quora的人员和通信主管Autumn Besselman说。

用户应明确,Claude与所有当前模型一样,会输出不合理内容。但是,这并不妨碍你与Claude 交谈。用开放、包容的心去使用吧,体验地址在这里:https://claude.ai/chats,祝您玩得愉快!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5574.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

漫画科普ChatGPT:绝不欺负文科生

图文原创:亲爱的数据 你所热爱的,都值得拥有一个名字。 世界上里程碑式计算机,问世之时大多拥有自己的名字。 我认为,假如计算机的诞生是元年,下一个元年将会是“奇点”。 不是比特币,不是虚拟现实&…

为什么说 ChatGPT 引爆第四次工业革命?

如果看不懂当下,请回忆历史,因为曾经发生过。 如果忘记了历史,请看看当下,因为历史正在重演。 我问佛:何为对的人? 佛说:一见你 ,就笑的人;一见,你就笑的人&a…

ChatGPT为我们带来了什么?

近两周,AI频频占据头条。 “用三秒完成我一天的活。”ChatGPT为中国众多的小型、产业链分布绵长的跨境电商企业降低了获得定制化方案的成本。许多商家相信,ChatGPT还能处理大量的财务报表和数据分析模型,这也广大跨境电商不需要再花钱聘请外…

利用 ChatGPT 解决某些网站文章不允许复制粘贴的限制

如下图所示,假设我想把这段文字复制下来,但是在浏览器里点击右键,会遇到 禁止转载的错误提示,此时 Ctrl C 也不工作。 可以在 Chrome 开发者工具里,切换到 Element 图标,把想要复制粘贴的文字对应的 elemen…

ChatGPT能为ERP带来什么改变

ChatGPT是什么 几十年来,企业资源规划 (ERP) 系统一直是许多企业的支柱。企业通过ERP来完成业务数据的采集、归纳、整理,生成反映业务状况的各式经营报表。但是它也是一项需要投入巨大的人力资源和硬件设备的项目,比如ERP基础数据的录入&…

为什么ChatGPT用Python实现?

可能你不知道, ChatGPT这个网站的后端居然是用Python实现的。 在一些人眼里,Python只能用来写写脚本、搞搞爬虫、做些小项目之类的,其实这是对Python的最大偏见。 因为Python早就被证明可以应用在大型项目中,特别是国外很多明星…

ChatGPT为什么那么火?

ChatGPT自推出以来,因其多样化的玩法,受到了世界各地互联网爱好者的热捧。打开 Google 关键字分析工具,我们可以看到,美国地区的ChatGPT 词条月搜索量已经达到 36 万次,热度持续不减。根据最新的消息,微软将…

反其道而行,大学教授鼓励学生用 ChatGPT 写论文

整理 | 屠敏 责编 | 张红月 出品 | CSDN(ID:CSDNnews) 新 AI 工具 ChatGPT 的到来,正在教育圈呈现出冰火两重天的态势,教授们几家欢喜几家愁。 这不近日,来自宾夕法尼亚大学沃顿商学院的一位专门研究创…

ChatGPT团队揭秘:3清华、1北大、1华科

Datawhale分享 分析:ChatGPT团队,来源:AIGC开放社区 Aminer和智谱研究发布了《ChatGPT团队背景研究》报告,深度揭示了这款火爆全球应用的背后团队的总体人员架构。 调查发现,ChatGPT团队只有87人,其显著特…

ChatGPT 团队阵容揭秘:3清华、1北大、1华科

程序员的成长之路 互联网/程序员/技术/资料共享 关注 阅读本文大概需要 3.5 分钟。 来自:Aminer和智谱研究 Aminer和智谱研究发布了《ChatGPT团队背景研究》报告,深度揭示了这款火爆全球应用的背后团队的总体人员架构。 调查发现,ChatGPT团队…

用ChatGPT写论文,震惊了!

当代研究生内卷现状—— 每天在实验室熬到半夜鸡叫,but,该有的实验数据一个也没得。 为了准备组会前一天呕心沥血搞ppt,but,老师的一句论文进度怎么样,瞬间颤抖。 那个总是抓住空隙打游戏的学弟发了一篇一作二区&#…

什么?还能让ChatGPT自己给自己写提示(Prompt)?

作者:ChenZhen 博客地址:https://www.chenzhen.space/🌐 版权:本文为博主 ChenZhen 的原创文章,本文版权归作者所有,转载请附上原文出处链接及本声明。📝 如果对你有帮助,请给一个小…

算法趣题-Q37

一、问题描述 二、问题分析 一开始,我使用了贪心的方式(也在C/C实现中,是错的),认为短视能够获得好的结果,运行结果确实是13步最少,但是路径却不是数组路径,debug发现在0开始的贪心路…

一些通过数学分析解决的算法题汇总

写在前面 如果觉得写得好,或者有所帮助,记得点个关注和点个赞,不胜感激! 我发现最近经常会遇到一些需要通过数学分析去解决的问题,做的时候想着各种方法,然后看到题解,发现可以用数学分析的方式…

演示求解中学数学题(Mathematica)

#高二解析几何题# 在[-3,4]区间上动曲线2x^24xc跟曲线1/3x^3x^2x有两个公共点,求c的取值范围. (现在高中的数学题难度已经算是高了;需要高等数学知识了) 直接求解: ClearAll["Global*"]; xmin -4; xmax 5; ymin -15; ymax 50; \ xnum 4; ynum 2; v Table[Ma…

算法-数学题

目录 50. Pow(x, n)54. 螺旋矩阵剑指 Offer 10- I. 斐波那契数列169. 多数元素剑指 Offer 39. 数组中出现次数超过一半的数字 191. 位1的个数剑指 Offer 15. 二进制中1的个数剑指 Offer 56 - I. 数组中数字出现的次数剑指 Offer 56 - II. 数组中数字出现的次数 II剑指 Offer 58…

文心一言 VS chatgpt (15)-- 算法导论3.2 4~5题

四、函数 ⌈ lg ⁡ n ⌉ ! \lceil \lg n \rceil ! ⌈lgn⌉! 多项式有界吗?函数 ⌈ lg ⁡ lg ⁡ n ⌉ ! \lceil \lg \lg n \rceil ! ⌈lglgn⌉! 多项式有界吗? 文心一言: chatgpt: 对于第一个问题,函数 ⌈ lg ⁡ n…

让Chatgpt帮你出Python练习题

最近发现Chatgpt有一个很棒的功能,感觉是让培训机构失业呀。 你可以让Chatgpt出Python练习题,能涵盖任意的知识点,对于初学者来说简直是福音。 Chatgpt在编程上面的对话能力是好于其他场景的,因为编程是机器语言,cha…

chatgpt赋能python:用Python计算数学题,速度快效果好!

用Python计算数学题,速度快效果好! 在现代化的信息时代,计算机已经成为了我们生活中不可缺少的工具之一。而对于数学爱好者来说,用计算机进行数学计算已经变得非常普遍,因为使用计算机能够快速解决数学难题&#xff0…

MJ基础入门之注册:超详细注册 Midjourney 及使用方法

如何注册并使用 Midjourney Midjourney是一款优秀的AI图像生成工具,它的综合能力十分强大且易于上手。使用Midjourney,您可以在一分钟内生成4张图像,这是非常快的。不仅如此,国外的很多图像创作者都在使用Midjourney,并…