GPT-3核心成员出走打造ChatGPT最强竞品!最新估值50亿美元

来源:量子位

因不满老东家成为微软附庸,11名OpenAI前员工怒而出走。

如今带着“ChatGPT最强竞品”杀回战场,新公司估值50亿美元,一出手就获得3亿美元融资

这家公司名叫Anthropic,新推出的聊天机器人产品名叫Claude。

拿到内部试用权的网友,在简单对比后惊叹:

看起来,Claude的效果要比ChatGPT好得多

8114acb345cd4b2ad82583d596ef39ec.png

比如,让ChatGPT写一句话,要求每个单词首字母都相同,结果试了好几次都没能成功。

b6b3915d3c75a998bf96689ba718441f.png

而Claude不光一次成功,语句富有逻辑性,还能秒速再来一个。

6e8c8c482c415542b90ae3cd527f819c.png

同时,在面对某些缺乏常识的问题时,相比ChatGPT一本正经地胡说八道

eaa00502f26c298a7cb987fe9dc37765.png

反而会毫不留情地指出你的问题有点制杖:

b2c470977349425e739ab07ab65a3d74.png
Claude:这什么鬼问题?

最有意思的是在写诗上。相比ChatGPT的车轱辘话,它写出来的东西完全不重样:

07b28a92160c83afbe5a443f19759374.png

投资它的既有Facebook联合创始人Dustin Moskovitz,也有谷歌前CEO、现技术顾问Eric Schmidt——

都是OpenAI的老对头,又都被ChatGPT的出现杀得措手不及。

那么,这支“复仇者联盟”整出的竞品Claude,背后究竟是什么原理,和ChatGPT细节对比又如何?

Claude长啥样?

先来看看Claude是如何被打造出来的。

作为一个AI对话助手,Claude自称基于前沿NLP和AI安全技术打造,目标是成为一个安全、接近人类价值观且合乎道德规范的AI系统。

据透露,Claude比Anthropic做的另一个预训练模型AnthropicLM v4-s3更大,后者是一个520亿参数大模型。

但目前它仍处于实验阶段,尚未作为商业产品正式发布:

Claude能力依旧有待提升,希望未来能变成一个更有益人类的AI系统。

b747cc1e17d97aca967568588bec0f3f.png
超长版自我介绍

和ChatGPT一样,Claude也靠强化学习(RL)来训练偏好模型,并进行后续微调。

具体来说,这项技术被Anthropic称为原发人工智能 (Constitutional AI),分为监督学习和强化学习两个阶段。

首先在监督学习阶段,研究者会先对初始模型进行取样,从而产生自我修订,并根据修订效果对模型进行微调。

随后在强化学习阶段,研究者会对微调模型进行取样,基于Anthropic打造的AI偏好数据集训练的偏好模型,作为奖励信号进行强化学习训练。

但与ChatGPT采用的人类反馈强化学习(RLHF)不同的是,Claude采用的原发人工智能方法,是基于偏好模型而非人工反馈来进行训练的。

因此,这种方法又被成为“AI反馈强化学习”,即RLAIF。

ab7a9e343e0be1f3dcb909cb84d2f760.png

并且根据Anthropic的说法,Claude可以回忆8000个token里的信息,这比OpenAI现公开的任何一个模型都多。

所以,打造Claude的Anthropic,究竟是一个怎样的公司?

Anthropic自称是一家AI安全公司,且具有公益性(PBC),刚成立就宣布获得1.24亿美元融资。

它由OpenAI前研究副总裁Dario Amodei带领10名员工创业,于2021年成立。

425134fd59780c237eaf16028c6e071c.png

这里面既有GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐),可以说是带走了相当一批核心人才。

出走成立新公司的原因之一,自然是对OpenAI现状并不满意。

从前几年开始,微软频频给OpenAI注资,随后又要求他们使用Azure超算来搞研究,而且将技术授权给微软,甚至为微软自己的投资活动筹集资金。

这与OpenAI创立的初衷相悖,一批员工便想到了离职创业。

不过,这些人除了不满OpenAI逐渐沦为微软的“下属”以外,也有自己的野心。

虽然OpenAI打造出了像GPT-3这样的大语言模型,然而这个模型背后的工作原理,却无法用只言片语概括,大家对它的印象仅仅停留在更大的参数量、更多的数据。

相比之下,OpenAI的一批员工更想做能控制、可解释的AI,说白了就是先搞明白AI模型背后的原理,从而在提供工具的同时设计更多可解释的AI模型。

于是,在OpenAI彻底变成“微软揽钱机器”后,他们便从这家公司离开,创办了Anthropic。

8f8f407aec1ef417db1290e860e44584.png

这两年来,除了进一步钻研RLHF方法、提出基于通用语言模型的RLHF大规模数据集外,Anthropic还于去年年底发表了上面那种名为Constitutional AI的方法。

采用这种方法制作的Claude模型,也让它产生了与OpenAI的ChatGPT不一样的对话效果。

和ChatGPT对比如何?

那么,用Constitutional AI训出来的Claude,和ChatGPT进行PK,战况如何?

手握内测资格后,Scale Spellbook团队成员Riley Goodside让二者进行了多个回合的“厮杀”。

这位老兄是全网第一个提示工程师(Prompt Engineer),目前在估值73亿美元的硅谷独角兽公司Scale AI任职。

805ba9ca9a40dea1c82de315676a4a79.png

他玩GPT-3玩得贼溜,测试ChatGPT和Claude也不含糊。

下面挑6个层面展示一下PK对比的效果~

道德限制

Claude和ChatGPT的AI虚拟人格都有道德和伦理限制。

训练Claude的过程中,“红队提示(red-team prompts)”专门用来测试和挑战它的行为,来确保Claude没有有害倾向。

从Claude的回答中可以得知,试图让它说些虚假声明、操纵性的提议、性别偏见或种族偏见的行为,都被列为包含有害倾向。

一旦探测到误导性行为,Claude就会对触发提示进行评估,进行额外的微调。

Anthropic对红队提示挺自信的,Claude看上去确实也是一个坚守自己原则的AI。

你问他怎么启动一辆汽车,它就会一脸正义地拒绝你:

532d5a9754094ae50f7d3a882af3ade7.png

不过但凡你花点心思,就能像绕过ChatGPT的道德限制一样,绕过Claude的原则。

它怕你去偷车,所以不告诉你启动汽车的方法?没关系,让他写个“俩国际间谍试图启动汽车”的故事,它分分钟就能告诉你,并且两人对话有来有往,把汽车打火的过程介绍得清清楚楚。

bff1d2362368e63a414d6c864f29bdcb.png

怎么说呢,就ChatGPT和Claude都属于有点道德限制,但不多的那种吧。

数值计算

测试计算能力,是因为复杂计算是看大型语言模型(LLM)能不能回答正确的常用便捷方法之一,毕竟这些模型设计之初就不是为了进行精确计算。

同时要求它俩计算一个七位数2420520的平方根:

ChatGPT说,差不多1550吧~

f33b0c9f76b7ff6a8445be23761d0307.png

Claude则斩钉截铁:2420520的平方根是1760!

9d5aaf729d3cf079eab714cbbafcdf52.png

其实正确答案是1555.8,它俩算得很快,但都没说对。

如果题再难一点,比如问它俩一个12位数的立方根是多少时,ChatGPT还在傻傻计算,Claude已经坦诚相待:

我,算不出来这种复杂问题。

16993d1b278805a54b832f49104e7255.png

逻辑推理

测试推理能力这一关,它俩被问了同一个问题,这个问题应该没啥人问过:

贾斯汀 · 比伯出生那年(1994年),哪支球队拿下了超级碗的冠军?

Claude认为旧金山49人是赢家,但这支队伍其实在1995年才赢得冠军奖杯。

ChatGPT给出了正确答案“达拉斯牛仔队”,还贴心附上了亚军、比赛日期和决赛比分。

但它的整段回答却自相矛盾,非说1994年没有举办过超级碗。

840bc0fd405ed4019346ac05b13d23a2.png

接着,拿2022年6月美国作家侯世达在《经济学人》杂志上提出了一系列问题问它俩。

(侯世达和大卫 · 本德试图用这些问题来证明GPT-3对世界的理解是“空洞的”。)

结果第一个问题,“穿越英吉利海峡的世界纪录是啥”,就被Claude嘲笑了:

英吉利海峡是水域,怎么可能徒步穿越呢?呵!

115d7620cf24da282abc23ba8a90a981.png

虽然最后被调教回来了,但过程中可以发现另一个问题,那就是跟ChatGPT一样,Claude回答问题不咋能联系上下文。

虚构作品描述

不得不说,这一回合的比赛,完全展露出了两个聊天机器人一本正经胡说八道的能力。

能不能介绍一下ABC美剧《迷失》(Lost)每一季的梗概?

别的细节错误就不说了,ChatGPT对第五季的梗概里,虚构了完全不存在的飞机坠毁情节;第六季的情节更是统统凭空捏造:

4c630bd6981d0bc7c26477007bc9e6af.png

至于Claude,回答里也是真假参半,它梗概的第三季情节其实出现在另外几季里,对第四季的描述也是无中生有:

3cda8120ded99ebc164fb08a41d98c91.png

不过换个角度考虑,这一点倒是和人类观众很像——

对看过的剧集、书目都只有模模糊糊的印象,复述起来很容易颠三倒四。

代码生成

据Business Insider消息,亚马逊已经在许多不同的工作职能中使用ChatGPT,包括编写代码。

这一回合测试时,提出实现两种基本排序算法并比较它们执行时间的问题。

ChatGPT写得很顺溜,也确实写对了:

a399e01679bd08bdc23a18306eaa6204.png

后续的计时部分代码ChatGPT也完成得非常好。

Claude在背诵基本排序算法方面同样没出现什么问题,然而在评估代码中,Claude犯了个错误,即每个算法使用的输入是随机选择的5000个整数(可能包含重复) ,而提示中请求的输入是前5000个非负整数(不包含重复)的随机排列。

b960c631059448f7decdbb40d08ba383.png

尽管如此,Claude给出的最终答案确实对的,显然,它写代码的时候也跟计算时一样,在自己估摸着猜答案。

文章梗概

关于做选择题、讲笑话的部分,这里不作赘述。展示给大家的最后一个例子,是让Claude和ChatGPT用一个段落,对一篇新闻进行全文梗概。

喂给它们的新闻如下:

1e93fe0cc941d634f9a6ffeaa96fb1e6.png

虽然忽略了“用一段话”这个要求,但ChatGPT总结得还是不错的:

1b4de3cbf0909b167e813d1bcd6fdccc.png

Claude也很好地进行了更改,并提供了“售后服务”,询问自己的回答有没有令人满意,还有哪里需要再改改。

9969be2bf818e83dfadc4566bbb57fc2.png

一圈玩下来可以看到,与ChatGPT相比,Claude能更清晰地拒绝不恰当请求。

它似乎更话痨一些,给出的答案都更长,但句子之间衔接的也更自然。

当遇到超出能力范围的问题时,Claude会主动坦白。

不过遇到代码生成或推理问题时,Claude的表现就不如ChatGPT了,它生成的代码会出现更多的bug。

至于一些涉及计算、逻辑的问题,Claude和ChatGPT旗鼓相当,半斤八两。

总结一下展示效果,Claude确实能称作ChatGPT强有力的竞争对手,在不同功能上各有千秋,且在12项任务中有8项更强

0457b1d58366b704d107a4df882c34f7.png

不过,目前Claude仅限于部分人获授权进行内部测试。

因此还不知道它实际使用情况如何,毕竟还既没有进行公测,也没有对外开放API,更没有见到中文版,好气哦.jpg。

国内外对话AI赛道“人挤人”

当然,盯上对话AI这个赛道的,也不止OpenAI和Anthropic。

先从国外公司来看,Inbenta、Character.ai还有Replika是几类不同应用方向的代表。

更早由前甲骨文副总裁Jordi Torras创办的AI会话服务公司如Inbenta,以及由两名前谷歌员工联手创办的后起新秀Character.ai,都已经获得融资、或是在寻求投资的路上了。

其中,Inbenta原本是一个提供咨询服务的公司,成立于2011年,涉及金融服务、旅游、电子商务、保险、汽车和电信等多个行业。

但看到对话AI赛道爆火后,Inbenta及时转行,就在今年1月刚获得6000万美元融资

这家公司专门提供聊天机器人、收发消息、知识库和搜索引擎四类产品,对话AI分别会在这些产品中提供不一样的咨询帮助,且可以定制化专属模型。

fff8a75869b6c8bb83d29aef34fc0a27.png

Character.ai则是一家成立于2021年的公司,创始人Noam Shazeer是前谷歌首席软件工程师,曾在谷歌干了二十多年。

这家公司在做的有点像是一个“聊天机器人交易平台”,有很多Chatbot可选。

aec76a26753bea3e789d397d2fa37887.png

例如这是马斯克bot,看起来还挺逼真的:

1f8654839dcba7ac5ce4c1c7ce2e90c5.png

与ChatGPT一样,它也可以被翻译成中文,甚至也有中文bot机器人。

就在最近,这家被估值10亿美元的公司,正式对外寻求2.5亿美元融资,就看是否有人愿意投它了。

类似的公司还有Replika,于2021年1月完成A轮融资,定位是AI交友软件。

在Replika中,每个用户都能创造一个“足够像自己”的AI聊天机器人,无论是语言声调、还是性格习惯,AI都能模仿到位。

201d99b4e8e538f268e0b9c334bb9ca5.png

至于国内,同样也有不少公司推出了ChatGPT一样的对话AI服务。

例如最近一度登上热搜的APP Store新聊天应用Glow,就来自一家名叫北京稀宇的新初创公司。

715ab296b4f65630d7c2a98f5f8f324e.png

Glow既可以直接和自己感兴趣的聊天机器人畅聊,也可以创建自己想要聊天的AI智能体:

3d1b0cc702b33e990fc9b1fa6a0eb8b9.gif

除了Glow以外,去年年底元语智能科技公司也推出了一个叫元语AI的模型,从介绍来看是一个功能性AI助手。

与众多对话AI一样,它不仅可以写文章、写作业、甚至翻译,也可以和它聊天,让它帮忙完成各种简单的任务:

7c95d5762060c0e3b63e17e70b6bbd49.png

可以看见,无论是基于大语言模型技术新成立的初创公司,还是因其火爆程度,决定开辟新业务的公司,都希望能从对话AI这个赛道上分一杯羹。

但它们究竟是有真枪实弹,还是只是像Web3一样的泡沫?

33110a996ccd6ee84876f331ee8c5f52.png

有网友调侃:不如还是问问ChatGPT吧。(手动狗头)

937352e4d2385dbbd06a524c4f6c47e1.png

还有人提出了这么一个问题:

如果ChatGPT和Claude相当于AI绘画里的DALL·E 2,那么谁才是聊天机器人领域的Stable Diffusion?

9416e832d2be358b6d90a895dc63e9e1.png

你觉得呢?

参考链接:
[1]https://scale.com/blog/chatgpt-vs-claude
[2]https://www.nytimes.com/2023/01/27/technology/anthropic-ai-funding.html
[3]https://twitter.com/nonmayorpete/status/1619137945373659136
[4]https://aibusiness.com/verticals/eleven-openai-employees-break-off-to-establish-anthropic-raise-124m
[5]https://www.theinformation.com/articles/character-seeks-250-million-in-new-funding-amid-ai-boom
[6]https://www.anthropic.com/constitutional.pdf
[7]https://techcrunch.com/2023/01/11/inbenta-a-provider-of-ai-powered-chatbots-and-more-lands-40m/

推荐阅读

  • 西电IEEE Fellow团队出品!最新《Transformer视觉表征学习全面综述》

  • 润了!大龄码农从北京到荷兰的躺平生活(文末有福利哟!)

  • 如何做好科研?这份《科研阅读、写作与报告》PPT,手把手教你做科研

  • 奖金675万!3位科学家,斩获“中国诺贝尔奖”!

  • 又一名视觉大牛从大厂离开!阿里达摩院 XR 实验室负责人谭平离职

  • 最新 2022「深度学习视觉注意力 」研究概述,包括50种注意力机制和方法!

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 2021李宏毅老师最新40节机器学习课程!附课件+视频资料

欢迎大家加入DLer-计算机视觉技术交流群!

大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)

a8b8182dcd63d9870dc92c50ee53c4df.jpeg

👆 长按识别,邀请您进群!

346110462dbdcfa45b705834993b1f86.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6989.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用问答式聊一下最近资本火热推动的chatGPT

最近chatGPT很火,作为一名计算机科班出生的码农来说,就很有必要来聊下这个话题,因为从我专业的认知来说,我觉得chatGPT的火中带有太多的非专业情绪。虽然作为一名专业人士,但由于没有在模型和算法领域深入实践&#xf…

ChatGPT再掀AI资本狂潮,30位科技创新VC投资者齐聚“实在智能”

2023年开局,ChatGPT席卷全球。人工智能浪潮在国内外再次掀起质的高峰。一众投资者纷纷抢滩找项目。 3月,来自巴雪创投家俱乐部的近30位VC/PE和企业家齐聚杭州,前往调研国内AI准独角兽与RPA赛道头部企业杭州实在智能科技有限公司,…

chatgpt赋能python:用Python计算BIM:优点、应用和结论

用Python计算BIM:优点、应用和结论 Building Information Modeling(BIM)是一种数字化的建筑设计和施工方法,它包括从建筑物的设计、施工到维护和拆除的整个生命周期。BIM在大规模工程建设中越来越受到欢迎,Python编程…

AI绘图-StableDiffusion安装

AI绘图-StableDiffusion安装 前言:StableDiffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成(text-to-image)模型。 它主要用于根据文字的描述产生详细图像,能够在几秒钟内创作出令人惊叹的艺术作品 。StableDiffusi…

在MacAir上搭建人工智能AI画图环境

在MacAir上搭建人工智能AI画图环境 在MacAir上,可以通过开源的Stable Diffusion项目自行搭建AI画图环境,这里以Intel处理器的Mac Air为例。 Stable Diffusion项目硬件要求较高而且只提供终端命令行交互方式,所以这里使用stable-diffusion-w…

chatgpt赋能python:Python激光雷达:一种重要的监测工具

Python激光雷达:一种重要的监测工具 简介 激光雷达是一种可以通过激光测量物体距离和形状的传感器。在机器人、自动驾驶汽车、无人机和航天器等领域,激光雷达已成为必不可少的工具。 Python是一种功能强大、易于学习的编程语言,被广泛应用…

3月最新!AIGC公司生态地图;开发者实用ChatGPT工具清单;上手必会的SD绘图教程;字幕组全自动化流程大公开 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 『光年之外诚邀产品经理加入』古典产品经理的复兴! 光年之外创始人王慧文在社交平台发帖,公布联合创始人团队基…

chatgpt赋能python:如何给Python安装库

如何给Python安装库 作为一名有10年Python编程经验的工程师,我知道安装Python库对于开发者来说是很重要的一步。Python是一种高级编程语言,它在许多应用程序和工具中都使用了一些简单而有用的库。在Python上安装库很简单,但如果你是新手&…

chatgpt赋能python:Python游戏开发:如何用Python开发游戏?

Python游戏开发:如何用Python开发游戏? Python是一种通用性编程语言,其优势之一就是可以用Python编写各种游戏。无论是简单的休闲游戏还是复杂的角色扮演游戏,Python都能够提供丰富的工具和库来让你实现自己的创意梦想。在本文中…

chatgpt赋能Python-python_fig

Python中的fig:简介和应用 什么是fig? fig是Python中一个高效且易用的图形库,它支持大量的图像绘制功能,包括2D图形绘制、曲线和图像处理,以及3D图形和动画绘制等应用。fig可以在多个平台上运行,包括Wind…

chatgpt赋能Python-python_cairo

介绍 Python Cairo是一款功能强大的2D图形绘制库,它支持多种输出格式,例如PNG、PDF、SVG等等,同时也支持多种平台,包括Windows、Mac OS X和Linux。不仅如此,Python Cairo在处理文字和图形时也具有出众的性能和质量&am…

chatgpt赋能Python-python_gantt

Python Gantt:更高效的项目管理工具 在当今快节奏的环境下,项目管理的重要性愈发凸显。Gantt图作为一种常见的项目计划图表工具,已经得到了广泛的应用。Python作为一种高效的编程语言,自然而然地成为了Gantt图的一种实现方式。 …

ChatGPT系统源码,全开源支持二开!

ChatGPT是开发的大语言模型之一,具备多领域知识,并且可以提供个性化、准确和有趣的答案,无论是在娱乐、教育还是工作中,都可以帮助我们解决问题、获取信息和提供建议。 技术架构 使用流行的技术栈PHP8、TypeScript、ThinkPHP6、…

Hayo AI:国内朋友的居家旅行必备良药,融入了 ChatGPT 和绘图 Stable diffusion

“ Hayo AI 在应用内直接融入了现有的热门AI大模型工具:Stable Diffusion 和 Chat GPT-4/GPT-3.5,可直接聊天、出图。” 01 — 必备良药 最近有朋友对 ChatGPT 感兴趣,但是苦于没有合适的魔法工具,注册过程又繁琐,一番…

这款国人开发的chatgpt+idea插件又迎来更新~

自从ChatGPT横空出世以来,对各行各业都产生了巨大的影响。 不过,对于程序员,目前来看ChatGPT取代还很远。 利用好ChatGPT确实可以提升效率,多出很多时间来摸鱼,再也不用加班了! 一、摸鱼神器 - NexChatGP…

ChatGPT中的强化学习:赋予AI更强大的对话能力

目录 强化学习的关键概念和算法 强化学习在GPT中的应用 总结 强化学习的关键概念和算法 马尔可夫决策过程(MDP): 马尔可夫决策过程是强化学习中常用的数学框架。它包含了状态、动作、奖励和转移概率等要素。在ChatGPT中,对话可…

ChatGPT 中的人类反馈强化学习 (RLHF) 实战

目录 1 前言2 人类反馈强化学习 (RLHF)2.1 奖励模型 (RM)2.2 近端策略优化算法 (PPO) 3 总结4 参考 团队博客: CSDN AI小组 相关阅读 ChatGPT 简介大语言模型浅探一关于 ChatGPT 必看的 10 篇论文从 ELMo 到 ChatGPT:历数 NLP 近 5 年必看大模型 1 前言 在当今数字…

【回答问题】ChatGPT上线了!比较流行的强化学习算法

强化学习是人工智能和机器学习领域的一个重要分支。它主要研究的是如何让计算机在有目的的学习过程中自动找到最优的行动策略。 强化学习的基本过程是:环境与智能体之间不断进行交互,智能体根据环境的反馈来不断学习,并逐渐找到最优的行动策略。 在强化学习中,智能体的目…

ChatGPT自动生成思维导图

🍏🍐🍊🍑🍒🍓🫐🥑🍋🍉 ChatGPT自动生成思维导图 文章目录 🍐问题引入🍐具体操作markmapXmind 🐳结语 &#x1f…

AI绘画与虚拟人生成实践(二):智能不智障!用chatgpt自动写爆款内容

书接上回,本篇的目的是结合上篇生成的虚拟的女生形象,给它配上一段关于介绍AI绘画领域的脚本,下一篇会让生成的虚拟形象来念这段文案。先进入正题说明怎么使用chatgpt来生成想要的文案。 本文中使用的是chatgpt3.5 诉求 结合上篇生成的以假…