GPT-4突然降智,爆料OpenAI重新设计构架,用MOE降本增效,官方辟谣网友却不买账...

63a1d7c3870ed5c678cb47d2038dfc29.png

编辑:润 Lumnia

【导读】最近众多网友反应GPT-4不好用了,后悔充值了。后来网友爆出OpenAI采用MOE重新设计了构架,导致性能收到影响,但是官方一直没有明确答复。

最近一段时间,很多OpenAI的用户反应,GPT-4变傻了!

068c790f002f57672ee04e4b32a45e0b.png

大家普遍认为GPT-4从5月份开始,生成内容的速度变快了,但是内容的质量下降很严重。

甚至有OpenAI论坛中的用户把自己生成的内容贴了出来,说对比2个月前相同的prompt生成的内容,现在GPT-4的能力最多能叫GPT-3.6。

ad273f542c3a3fbeb3c2f472ea2ec44d.png

纷纷表态心疼自己出的这每个月的20刀。

3bcf06afe8478485eee5d98568c22042.png

b80e805d44edf7148fbd349027634588.png

不过看完这么多GPT-4重度用户的吐槽之后,小编突然开始感叹:

GPT-4确实是领先太多了。

e3e58fdf6e87656a9582a5f1cc2a879f.jpeg

领先程度已经到了,其他家的大模型都在加班加点的几天出一个更新版本,希望尽快赶上OpenAI。

他自己家倒好,悄悄「降本增效」「反向升级」,当起了大模型圈里的「反内卷标兵」。

可能导致性能衰退的原因

对于GPT-4表现降级,用户似乎都已经达成共识,已经开始讨论GPT-4「衰退」的原因了。

c956281c0fba74a1955ed0f91af3e234.png

根据外媒报道,有些语言模型领域内的专家猜测,OpenAI正在创建多个行为类似于大型模型但运行成本较低的小型GPT-4模型。

根据一个名叫Sharon Zhou的专家的说法,OpenAI采用了一种称为「混合专家模型」(Mixture of Experts,MOE)的构架来搭建GPT-4。

每个较小的专家模型都在不同的任务和主题领域进行训练。

可能会有一个专门针对生物学的迷你GPT-4模型,或者其他专门针对物理、化学等领域的迷你模型。

当一个GPT-4用户提问时,新系统判断之后会把提示发送给某一个或者几个专家模型。

「这个思路已经存在一段时间了,这是一个自然的发展方向。」Zhou说。

Zhou将这种情况比作「忒修斯之船」,船上的各个部件被逐渐更换,整条船慢慢变成了一条新船。

ddc08f1d7fb2b0eccdac545bf0b69561.png

她说:「OpenAI正在将GPT-4变成一支由小型船只组成的船队。

从我的角度来看,这是一个新模型,但是可能很多人也不会在意这个变化。」

在本周网上泄露了关于GPT-4大量参数细节之后,很多大佬们也针对里面提到的MoE部分给出了自己的评价。

Allen人工智能研究所创始首席执行官Oren Etzioni在外媒的采访中写到:「我觉得这些猜测大致是准确的,虽然没有办法确切证实。」

他解释说,使用MOE有两个主要原因:更好的生成响应和更便宜、更快的响应。

Etzioni补充说:「正确的搭配混合专家模型将同时保证这两方面的优势,但和任何事情一样,成本和质量之间通常是需要取舍的。」

如果这种假设成立的话,OpenAI在降低成本方面可能确实牺牲了一些质量。

另一个佐证就是,OpenAI的创始人Greg Brockman曾在自己共同参与的研究中提到了MOE这一技术路径。

「通过混合专家模型的(MoE)方法,每次只使用网络的一小部分来计算任何一个输入的输出。这可以在不增加计算成本的情况下增加更多参数。」Brockman和他的同事Lilian Weng在论文中写道。

619791bd4fbc4eedd707bcd9d988b180.png

性能下降可能和消除有害内容有关

除了大佬从技术层面的解析外,网友也纷纷从各个角度进行揣测。

有些网友觉得可能是OpenAI相对保守的道德政策降低了模型回复的质量。

在OpenAI官方论坛中GPT相关的子版块,那些认为ChatGPT的性能遭到了「降级」的帖子中,许多人提到了ChatGPT在OpenAI采取新的内容限制之前对于Prompt的包容性有了很大的变化。

侧面支持了OpenAI可能出于安全性的考虑,控制了模型的输出能力和范围的观点。

c5fa86bb23e08b2cebfd5ede682d592c.png

在YCombinator的讨论中,有网友提出,从OpenAI开始宣布关注安全问题以后,模型的表现就越来越糟糕。

以GPT-4在最初发布报告中,让GPT-4使用TikZ(TikZ可能是在LaTex中创建图形元素的最复杂,最强大的工具)绘制独角兽这一任务为例,在后续发布的GPT-4中难以复现报告上的结果,而且表现也越来越差。

d9f9a94701fe639287a071f4f03a0b10.png

另一方面,网友认为GPT-4性能衰退的原因,可能是人类出于安全考虑向GPT-4灌输了一套相互矛盾的信念。

而这种为了安全选择消除「坏念头」的做法,显而易见会阻止GPT-4对事物更加深刻的认识和理解。

e638788abb9daecc96031e02cfcc17a5.png

事实上,OpenAI设置了各种过滤器来防止恶意行为,例如暴力,种族主义或仇恨言论。

但是,这些过滤器通常会干扰正常的使用,例如小说写作、思想头脑风暴以及其他形式的创作。

虽然很难衡量这些变化的影响,但OpenAI的创始人Sam Altman承认了政策限制会干扰用户体验。

bd30c8c8bc9bdcccaa9996a23ac22beb.png

除此之外,在5月29日Humanloop联合创始人Raza与Sam Altman的对话中,Altman提到了OpenAI目前严重受到GPU数量的限制。

44c20e4be572c50880b0ee3b7262d56f.png

在ChatGPT突破了1亿用户大关、月活达到18亿次的情形下,OpenAI的服务器经常超负荷运转。

而算力的紧缺不仅推迟了他们许多短期计划,也导致了许多来自客户对GPT回答内容可靠性的抱怨和争议。

85c990991a2d2f1aca241b34a49406ab.png

也许原因在这届网友身上?

在官方技术发言人Logan.GPT的回应中,表明了GPT-4在API模式中质量并没有下降。

30243ae6cf7899609087ae8fbe017e0a.png

c35638baff91680cb7a18c99ac00e75a.png

75f25e185ca8f289aaf6ed36b8a7bdf4.png

而就在昨天,OpenAI产品副总裁Peter Welinder评论了这一传言。

aac6392dbc34160963c0219f82f789c4.png

 「不,我们没有让GPT-4变笨,恰恰相反:我们让每个新版本都比前一个版本更聪明。」

对于网友提出的问题,他的理解是,「当你更多地使用它时,你会开始注意到以前没有注意到的问题。」

言下之意是,GPT-4本来就没之前那么强,现在的GPT-4才是它真正的实力。

有那么一丝凡尔赛的感觉。

8bf8d69a3a152b6d4ce571727e0bce70.png

果然网友不是很买账,在推文下不停回怼。

457fdcedcfaf6939e6bf5cb40bdd15df.png

你说你没改过,然后又说每个版本都更好了,不是自相矛盾吗?

aa8bcbaa9b60f035dc4f7f3a517e0073.png

你说的这个假设不成立,同样的提示词7月的回答就是比6月的差!

不过,确实有网友对GPT-4的性能衰退也有不同的解释:

从感知退化的心理学角度来说,在GPT-4初次曝光带给人们的惊喜消失,并逐渐深入我们日常生活使用后,人们就会对它的能力习以为常。

新鲜劲儿一过,用户对其的容忍度也随之降低,转而更加关注技术和使用上的缺陷。

769f7a94e06c93ddb4f179a941b54a9b.png

此外,在 Reddit 上发帖认为GPT-4性能衰退的网友,在最近的更新中表明,那天的提问可能是受到了心态的影响,因为在这之后的GPT-4工作一直都很顺利。

c673ca88354e0e497203e63248bb713a.png

参考资料:

https://the-decoder.com/openai-comments-on-reports-of-gpt-4-performance-loss/

最后推荐下ChatGPT前沿玩法圈:

现在价格只有169元,过400人后,马上就会涨价一波,直到涨到原价999。目前加入都是最低价格。

2d9f11cbd8bb5342d7ce400a52a10961.png

所以如果你真的感兴趣,一定建议这个阶段加入,我们特别推荐,加入知识星球3天内如果不满意,可以无理由退出,然后款项原路返回,你也没损失.

哪怕你进去逛了3天,相关资料打包都拿走了,都是可以的,至少可以让你学习到一些内容。一个人格局要打开。只要你在做有价值的事情,总有人会认可你的。

不到一个月时间,我们输出了100+内容,3大专栏内容更新了58+文章:

ff342d4ad2269bca402db81d9911ac90.jpeg

不到一个月时间,我们输出了100+内容,3大专栏内容更新了58+文章:

我会把我玩ChatGPT的经验和总结,除了我不会研发ChatGPT,其他诸如Midjourney,GPT Plus,ChatGPT PDF,ChatGPT XMind,ChatGPT PPT 会以专栏的形式在知识星球更新。

最后再说下这个星球能给大家提供什么:

1、ChatGPT的使用方法,最新资讯,商业价值。
2、一些副业思考、创业案例、落地案例分享。
3、探讨未来关于ChatGPT的机遇,帮助大家解决遇到的问题。
4、剖析和拆解ChatGPT不同的前沿玩法。
5、围绕ChatGPT玩法的变现方式和技巧。
6、围绕ChatGPT提高工作效率。
7、第一时间了解ChatGPT最新版本的发布特性和强超能力
8、掘挖ChatGPT玩法,助力们我的事业,工作,和日常生活
9、加入星球的小伙伴,都有两项额外福利,可以免费获得ChatGPT普通号“独享”账号一个,支持改密码。

陆续更新中…

其它福利还在筹划中… 不过,我给你大家保证,加入星球后,收获的价值会远远大于今天加入的门票费用 !“早”就是优势,建议大家尽早以便宜的价格加入!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/48444.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python怎么装Matplotlib

Python怎么装Matplotlib Matplotlib是针对Python语言的绘图库,用于绘制二维图形和三维图形。这个库提供了多种不同的绘图选项,允许用户自由绘制不同类型的图表。Matplotlib是Python科学计算生态系统中最常用的绘图工具之一。 为什么要使用Matplotlib&a…

chatgpt赋能Python-python模块查看

介绍 Python 是一门非常流行且受欢迎的编程语言,它有许多优秀的特性和功能,使其得到了众多开发人员和企业的认可。其中,Python 的模块是一个非常重要的概念,它们允许我们组织和扩展我们的代码库,并在多个项目中重复使…

chatgpt赋能python:Python为坐标轴命名——让图表更加清晰易懂

Python 为坐标轴命名——让图表更加清晰易懂 在数据可视化中,为坐标轴命名是非常重要的。这不仅可以帮助您向读者传达信息,还可以让图表更加清晰易懂。Python 已成为数据科学领域最受欢迎的编程语言之一,并且其绘图库提供了灵活的选项来为坐…

软件开发计划书

1.引言 1.1背景 汽车作为交通工具,在人们的日常行为生活中发挥着极为重要的作用。近十年来,汽车也越来越普遍,不再是一种奢侈品。而很多人也都把汽车当做了一个小家。而当前汽车室内的管理还不够智能化,人们在使用汽车的时候也会…

私域流量企业团队运营工作规划方案甘特图表格

私域流量企业团队运营工作规划方案甘特图表格 网盘文档下载地址https://pan.baidu.com/s/1WJ5XnWCfarPYe8xagY88Cw?pwdw56h 主要分享其中的三个思维模型,第一,先胜而后战,第二至人而不至于人,第三胜可知不可为,听起来…

如何打造一份it项目计划书

一份专业的IT项目计划书应该包括以下几个部分: 一、项目背景 二、主要任务 三、工作量评估 四、项目计划 五、项目交付件 六、附件 七、价格 八、需求变更管理 一、项目背景 项目的相关介绍。可以从以下几个方面来写: 为什么要做这个项目? 项…

60个项目管理甘特图模板,可编辑,可下载

今天和大伙分享的是60个可编辑的 项目管理甘特图 可更改 可下载 这么多样式 总有一款适合你 ↓↓↓ 项目管理甘特图部分样板查看 项目管理套表 ......

【App设计】互联网+商业计划书

原计划书地址:https://pan.baidu.com/s/1VhlZJhgiC89plJ02yRD_9g 今天我们来谈谈共享图书App的设计 首先该APP的主体功能有借书、还书、社区、社区等。 界面原型如下:(这个界面是我大三做的校园app的界面,比较通用,…

最全面、最系统的商业计划书指南

目 录 1 为什么写好商业计划书很重要? 2 你的想法会被投资人拿走或抄袭吗? 3 什么时候需要准备商业计划书? 4 商业计划书写多少页最合适? 5 PPT,WORD,PDF用哪种格式? 6 商业计划书先写什么&…

商业计划书文档+PPT公开下载

包含商业PPT模板,很多创业比赛的商业计划书,有需要的直接下载吧! 阿里云盘分享https://www.aliyundrive.com/s/Nzrtg7687r2

最全面测试计划书模板

XX项目名称 测试计划 文章目录 XX项目名称 测试计划1.测试背景2.测试目标3.测试范围4.测试输出文档5.测试工具6.测试规模以及工作量分析7.测试进程7.1 测试流程表7.2 测试过程描述a.测试计划阶段b.测试用例阶段c.测试阶段d.测试总结阶段 8.测试进度及时间资源9.测试轮次安排10.…

体验 GPT-4 后,回顾 OpenAI 发展历程及感悟

从 ChatGPT Plus 发布第一天就开始重度使用,刚刚和新发布的 GPT-4 进行了 20 多轮对话,来简单介绍下这几个模型背后的技术,并且分享下感受。 GPT 在发展历程中,一共经历了 4 个阶段,分别是 1、2、3、4。这几个阶段分别…

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目Debugging进阶实战(六十二)

本文继续围绕工业级业务对话平台和框架Rasa,对Rasa对话机器人项目实战之教育领域Education Bot项目Debugging过程中关于NLU组件加载运行,各个policies如何进行预测,ResponseSelector如何选择response等内容进行详细分析。 一、Rasa对话机器人项目实战之教育领域Education Bo…

openai接口调用chatgpt的api,python版本

openai开放了chatgpt的api接口供程序调用,python版本的调用方法和参数说明的代码如下所示: import openai # api_key每个账号都可以生成一个对应的api_key拥有免费的5刀流量 # 生成api_key的地址:https://platform.openai.com/account/api-k…

java怎么调用openai接口

OpenAI提供了一个REST API,可以通过Java调用。可以使用Java的HttpClient类来发送HTTP请求,以调用OpenAI API。具体步骤如下: 1. 创建一个HttpClient对象,用于发送HTTP请求。 2. 构造一个HttpPost对象,指定OpenAI API的…

亚马逊AWS与凯捷、富通云腾、神州泰岳达成战略合作

亚马逊旗下公司Amazon Web Services, Inc. (AWS) 在AWS 2019年度合作伙伴峰会上宣布拓展中国合作伙伴生态的战略步骤,分别与凯捷咨询(中国)有限公司(Capgemini,中文简称凯捷)、富通云腾科技有限公司&#x…

【​观察】全国首个智能语义平台上线 神州泰岳开放语义技术的“图谋”之大...

申耀的科技观察 读懂科技,赢取未来! 如果说过去十年是互联网颠覆商业模式的十年,那么未来十年人工智能则有极大的可能接棒互联网,成为新的风口并产生新的商业机会。 而在这个过程中,被公认为人工智能“皇冠上的明珠”的…

神州泰岳的服务流程业务方向

产品概述 ⊕产品理念    ITIL(信息技术基础架构库)在IT服务管理领域的地位无可置疑,作为ITSM(IT服务管理)最佳实践标准,成为了解及衡量IT服务价值的渠道。尽 管全球存在差异化应用环境,但是许…

双叒叒降价,阿里云为企业用云和开发者打开AI大模型的一扇窗

来源: 首席数智官 hello 大家好,我们是数字化领军者都在看的首席数智官。 关注我,每天给你讲一个商业案例。 今天我们要给你讲的是:通义千问火爆全网后,为什么阿里云产品反而大降价? 「面向AI时代&#…

CodeArts持续发力输出,华为云重塑软件开发

配图来自Canva可画 互联网时代,软件技术对企业成功的助益越来越明显。不管是为了顺遂大众趋势,还是迫于生存压力,可以确定的是,目前各类软件的开发已经被纳入众多企业的发展规划当中。 只是,长期以来国内软件行业一直…