ChatGPT也涨不动了

将深燃设为“星标

第一时间收到文章更新

2f00ae9b17daf8c8b480c1ff073882e4.jpeg

深燃(shenrancaijing)原创

作者 | 李秋涵

编辑 | 魏佳

你还在用ChatGPT吗?

在全球掀起AI热潮的ChatGPT,似乎进入了瓶颈期。

首先是关于ChatGPT的使用率,有不利的数据出现。6月初,摩根士丹利发布的一项调查显示,只有19%的受访者表示他们之前使用过ChatGPT,只有4%的人表示依赖ChatGPT。调查表示,比例低的惊人。

这项调查在今年4月进行,涉及人数为2000人。不过,在全球78亿人口面前,这样的样本量不算大,也一定程度上降低了其参考性。

还有一个基数更广泛的数据值得关注,ChatGPT的增长已经明显放缓。

根据网站数据分析工具SimilarWeb数据,前期ChatGPT的访问量增长率惊人,1月份的环比增长率为131.6%,2月份为62.5%,3月份为55.8%,在4月份明显放缓,环比增长率为12.6%,到了5月,这个数字已经变为了2.8%。

随着ChatGPT普及,参考基数变大,增长率放缓是正常现象,不过,根据目前已有的趋势来看,6月的环比增长率也有可能为负数。

今年年初,ChatGPT像一声惊雷,让全球见识到了生成式AI的威力,也让背后的GPT(生成式预训练Transfomer模型)大火,掀起大模型创业潮。它刷新了很多数字,最让人印象深刻的,是史上用户增长速度最快的消费级应用,在推出仅两个月后,ChatGPT的月活用户已经突破了1亿。

但对它未来的发展,即便是创造者也很难给出明确答案。此前OpenAI董事会成员海伦·托勒就曾表示,“甚至创造它们的人也不知道它们能做什么,不能做什么。我预计,我们真正了解GPT-4能做和不能做的所有事情,可能还需要几年时间。”

ChatGPT现在的天花板,不代表就是GPT的天花板,但作为目前最厉害的大语言模型支撑的产品,ChatGPT的走向,也能成为观察GPT应用的一个窗口。关于AI的狂想还在继续,时间已经过去了近半年,我们好奇的是,ChatGPT的使用情况到底如何?它被高估了吗?

9dacabecf9e765213f1b99cccf2562e2.png

ChatGPT真的很多人用吗?

对于ChatGPT的使用体验,不同行业、不同人答案不同。有人把它当玩具,使用了一两次后就不再登录;有人努力把它变为工具,在工作中以提高效率;也有人,在努力将ChatGPT变为工具的过程中失败了,因为觉得它“不够好用”。

夏楠属于第三种。她从事外贸行业,会用ChatGPT写工作邮件,也会让它解答一些生活中的烦恼,为了能更好的使用ChatGPT,她都是用英文发指令。

从2月开始使用ChatGPT,她的体验分为了三个阶段,最开始是好奇,很多问题都想抛给ChatGPT,看它怎么回答,探索它。从5月开始,她感觉ChatGPT“变笨了”,之前能做到的,现在做不到了。现在,她对ChatGPT的评价是,“不好用”。

比如最近,他们公司接了一个炒菜机器人的ODM(原始设备制造)业务,她想让ChatGPT提供这个市场的预测数据,在反复推拉后,ChatGPT还是没有给她答案。而在写工作邮件上,经过调教,ChatGPT也只给到她一个命令式的跟进邮件,文字官方式的长篇大论,也不是她想要的,她希望“它能写出有礼貌的,信息表达很明确的邮件”。

她觉得,ChatGPT之所以做不到,短板在于“不懂得人情世故”。得不到想要的结果,她的使用频次也降低了,从一个星期五六次变为了一周一次。

当然,之所以会有这样的体验,背后综合影响因素很多,和使用者是否问到了ChatGPT擅长的领域有关,也要看使用者有没有找到与ChatGPT合适的交流方式。

正在澳大利亚生活的Lucy,从去年底ChatGPT一推出后就开始用英文使用它。现在,她日常用ChatGPT来整理学术研究上的思路、学习语言,是生活里必不可少的工具。只是,准确性的问题一直让她烦恼,文献参考需要自己找,“如果我质疑它的回答,它就会顺着我的思路回答”。

除了ChatGPT的使用体验感受不一,从数据来看,ChatGPT的普及率,暂时也还没有想象中的广。

347904327ff8f9fa5989768c26c135ea.png

摩根士丹利相关报告截图

除了摩根士丹利的报告,还有一些数据可以作为佐证。根据SimilarWeb数据,3月-5月,美国、日本是全球为ChatGPT贡献流量份额最高的国家,分别位列第一、第三。不过,最近,美国的流量已经下滑了10.28%。

8e07ae059b09d7b8f103eac21cd05c6f.png

ChatGPT的全球流量分布 来源 / SimilarWeb数据

美国方面,在5月底,皮尤研究中心发布了一份调查,他们在今年3月中旬在1万多名美国成年人当中展开调查,18%的人听说过很多关于ChatGPT的事情,39%的人听说过一点,42%的人根本没有听说过。

而在日本,根据日本ICT市场调查咨询机构MM总研的最新调查报告,5月24日-31日期间,以日本及美国企业所属的13814名员工(其中,日本13412人、美国402人)为对象,进行的网络调查结果是,日本企业的ChatGPT使用率仅7%,与美国企业的51%使用率相比,两者相差高达44个百分点。

日本企业中,近半数员工(46%)回答“不知道”ChatGPT,而即便知道ChatGPT,但回答“未使用”的比重也达42%。

这些都是最近的报告,样本量在1万人左右。不过ChatGPT大热后,全球关于它的使用报告众多,观点不一,甚至有的得出的是相反结论。上述报告有一定参考性,但也因地域和人群的差别,不一定能完全反应真实情况。

还有更明确的值得参考的整体性数据,可以帮助我们认识ChatGPT的应用现状。

根据SimilarWeb,ChatGPT增长明显放缓,尤其到6月,截至6月20日,6月已经过去三分之二,访问量比5月少了38%左右,粗略推算,到6月31日如果没有特别新的刺激,6月的环比流量或将下降。

53638db11d0cbe7724f93e9f8ea3190a.png

ChatGPT近期流量变化 来源 / SimilarWeb数据

同时,还可以参考的是,根据SimilarWeb,在5月,ChatGPT的跳出率是12.59%,低于谷歌、Youtube等,而在6月24日,跳出率已经上升到37.37%。平均访问持续时间也从8分32秒,下降到7分48秒。

另一个数据是,接入GPT大模型后Bing的市场份额变化。

20b9c46cb1acd23d120cec02094957b3.png

来源 / Statcounter

Bing的市场占有率,在二三月份刚引入GPT时引发关注,根据网站通讯流量监测机构Statcounter,2023年3月Bing的市场份额是2.86%,5月是2.77%,不仅占比没有提高,甚至还有下降趋势。

f1874a3927510889dda32dc1e5ba26e2.png

是什么限制了ChatGPT?

关于ChatGPT应用上的问题,已经老生常谈,不过这些问题对它应用普及上的影响,或许比想象中广。

首先是“变笨”这件事。

6月初,“ChatGPT变笨了”的声音引发过讨论。不过OpenAI开发者推广大使Logan Kilpatrick曾出面回应,表示自3月14日发布GPT-4以来,大模型的本体一直处于静态,不存在大量外部数据污染模型的情况。同时他也承认,大模型本身存在不稳定性,因此对相通的提示词,存在回答前后不一致的情况。

一位AI从业者告诉深燃,5月就有国外从业者在OpenAI论坛里分享论证GPT变笨的文章。最近,他用GPT-4的API做了测试,让它做简单的计算题。从结果准确度来看,GPT-4-0314取得了满分,GPT-4取得了80分,GPT-4-0613,勉强可以拿50分。其中,0314、0613即指3月14号、6月13号的快照(指整个系统在某个时间点上的状态)。这个结果,给他一种GPT-4在被削弱的感受。

61be9be0b6f9072b5391e25e395f1542.jpeg

来源 / unsplash

根据监管机构NewsGuard的专家分析,OpenAI最新版本的GPT-4,在输出信息方面,比GPT-3.5要糟糕。在今年3月份发布的报告中,NewsGuard提到,GPT-4不仅在其研究人员的提示下回答了完全虚假的新闻叙述,而且比GPT-3.5回答的内容更差。

在上述AI行业从业者看来,这样变化的结果是,用户需要变得更为具体和主动地引导GPT-4,才能获得与过去相当的回答质量。

这也再度影响ChatGPT的使用门槛,而这与ChatGPT的初衷有所背离。

最开始ChatGPT爆火,就有业内人士对深燃分析,它带来的影响是将通用人工智能放在了每个用户面前,也把人机交互的门槛,打到了最低点。

但目前来看,门槛还是存在。从ChatGPT的用户画像,也能看出这个产品的普及情况。根据SimilarWeb数据,使用者主要分布在计算机电子与技术行业,其中,编程和软件开发占比最大。其他行业里,只有游戏行业中的视频游戏机和配件的从业者占比较多。

在使用ChatGPT的体验上,一位工程师给深燃的反馈最为积极,表示一直在用,“能帮我解决小的程序上的问题”。

尽管都说,“淘汰你的不是AI,是会用AI的人”,如果普通人使用起来门槛越来越高,那也一定程度上脱离了ChatGPT的初衷。

还有两个问题,是ChatGPT从最开始就面临的质疑,即准确率和隐私保护。

根据上述日本相关机构的报告,在被问到今后若要继续/扩大使用ChatGPT,需要解决什么问题时,日本企业、美国企业分别有高达49%、45%的回答是“案件的精度”,其次为“个人资料等隐私(日企34%、美企35%)”,和“对问题的理解程度(日企33%、美企34%)”。

准确度方面,OpenAI的CEO山姆·奥特曼,也做出过解释,这个程序会自信地宣称一些东西是事实,但其实它是编造出来的,就像谎话连篇的政客一样。他给这种现象起了个名字——“幻觉难题”。

总之,准确率要实现起来非常不容易。原因就是因为它不是靠记忆,而是凭借演绎推理能力来工作。“大语言模型靠的是推理的拼字游戏,不可能像数据库一样完全准确,人也不能完全保证准确”,关注AI行业的工程师杨阳告诉深燃。

隐私方面,OpenAI至今还没有给出明确的解决方案。在加拿大工作的小虹就告诉深燃,公司特地发邮件通知,让大家谨慎使用ChatGPT。

基于这些限制,ChatGPT的应用场景也受限制。

关注产业的投资人陈默默告诉深燃,它其实适合“生产力驱动”的内容生产,而不是“创意驱动”的内容生产,在前者上,能替代不少有重复经验累积的人力。

用户洛洛从4月开始使用ChatGPT,她开了会员,主要用于写脚本和文案,“只要能给它正确的公式,基本可以反馈给我任意思维的脚本,只是拿到手要改”。她表示,产出的脚本比较基础,没法做成爆款,但它逻辑没有问题,“像公司日常的一些大量的视频输出,是可以支持的”,她现在的ChatGPT使用频率,基本上一周3次以上。

现在夏楠调整了策略,只问它一些流程式的问题,比如开ebay网店的流程。尽管这类问题也可以问谷歌、百度,但“ChatGPT的回答更好”,她举例,最近她去德国旅行,让ChatGPT给她安排旅游计划,给出的答案有参考性,交通安排的也很清楚。

这些长期使用ChatGPT的用户,不论对ChatGPT的使用体验满意与否,他们都提到,ChatGPT更像是一个升级了的谷歌、百度,带来了一定助力。

446895a0ae03fa15361a287e96ea2886.png

ChatGPT,象征意义高过实质意义?

最近,OpenAI推出了类似于LLM版的App Store,加速生态的建设,还被曝光了一些功能上的优化。这背后也隐藏着一个信号,GPT4暂时已经到天花板,要加速生态建设,在GPT5出不来之前,先做一些体验上的优化。

早在4月,山姆·奥特曼就表示,还没有开始研究GPT-5,也没有立即开始的打算,还曾表示,“大型模型时代已经到头了。”

据OpenAI官网,GPT模型参数数量(可以理解为喂养模型的语言材料)在不断提升。GPT-1是1.17亿,GPT-2有15亿,到了GPT-3,飙升至1750亿,GPT-4,根据国外媒体机构Semafor的一份报告,比GPT-3大六倍左右,具有1万亿个参数。

此前杨阳也对深燃表示,或许GPT-4就成长到头了,语料是一个原因,“人类历史上创造出的优秀资源就这些了”,模型本身的限制也是一个原因。在他看来,现在GPT-4被限制了,应该有能力没有被完全开发出来。

近日,Facebook母公司Meta首席人工智能科学家Yann LeCun就指出,ChatGPT背后的生成式人工智能技术已进入了死胡同,拥有太多的局限性。

出于巨头间的竞争关系,或许很难将这话作为客观参考。但可以肯定的是,ChatGPT的确遇到了瓶颈。

要让大语言模型有更好的应用,不少人把视线投向垂直领域的应用上。

AI行业从业者秦凯对深燃做了一个比喻,ChatGPT这类泛化型的人工智能,应用宽泛时,能力就像是高中生、大学生,和垂直场景结合时,fine-tuning(在自然语言处理中使用的技术,也叫微调)的数据足够精确和贴合场景,能力就能变为硕士、博士,能解决更具体的需求。

杨阳也认同这一看法。他提到,目前的模型最多只能进行一倍左右的优化,“大家有一个基础共识,GPT-5来了,也不会带来颠覆性的进化”,短期内不可能达到AGI(通用人工智能)水平。

eeeb56da9cf455f5469e4ab7bf213a5a.jpeg

来源 / unsplash

不过,他表示,现在做具体垂类应用,首先是费用高,训练模型对公司来说依旧是不小的成本;其次是数据安全、数据隔离的问题,目前采用的办法是,“在大模型基础上套小模型”,但带来的问题是,现在的底层技术还在变化,“没有人知道下一个模型,更优秀的模型什么时候出现”,这个中间阶段让大家很迷茫,“如果三五年后才出现,那现在基于大模型做垂类的产品是不亏的,场景落地后有机会回收资金。但如果很快就出现了,那大家现在做的外挂型垂类产品,是没有多少意义的。”

投资人陈默默表示,这是一个“先有鸡还是先有蛋”的问题,他们还是愿意去看相关项目,在细分领域里切一个特定场景的应用,因为“哪怕未来的底层有变化,只要行业没有变动,在应用层的行业理解上还是会有沉淀”。

但他们在看项目时遇到的问题是,很难有人可以明确告诉他们,产品能节省多少人力成本。“看下来,还是得给机器配个人”,她举例,关注赋能研发端论文筛选归纳相关的垂类产品,实际使用也还是需要一个人顺着机器的结果,再做进一步验真、开发和研究,实际上很难说效率有特别好的优化”,所以现在,一些投资人都会倾向于再观望观望。

在关注垂类领域的AI创业公司的产品时,她的感受是,“我们对技术带来的产业升级机会保持谨慎乐观,目前可能它的市场意义,高过实质意义”。

秦凯总结,人们对ChatGPT的期望过高,但有两个瓶颈。首先,下一代大语言模型通过更大的参数规模和更强算力的收益边际递减,人们的期望可能无法很快满足。其次,当前的大语言模型是泛化的,需要很长时间来解决特定、真实的问题。目前垂直领域的生成式AI,已经变成了针对具体企业做定制化需求和私有部署的体力活,“底层模型依靠transformer方式缺乏解决非常复杂问题的能力,现在的应用情况与预期的水平相距甚远”。

应用还在继续,技术还在发展,关于ChatGPT的应用及潜力还需要再观望。即便是这样,ChatGPT已经让一些人的生产效率,有了一个数量级的提高,即便当下有瓶颈,“ChatGPT已经是很伟大的产品,这就够了。”杨阳表示。

*题图来源于unsplash。应受访者要求,文中夏楠、Lucy、杨阳、小虹、洛洛为化名。

15ef799961c48432b3154d856831c3d1.png

dc15dfc2d957ce8949b989d2fcf67964.png

75efdecc75c32c0fb17b6808ac78f374.png

3b8ec0e6780ba30cd770a29b5d191ba4.png

你还在用ChatGPT吗?

*欢迎留下你的观点。

*原创文章转载、进读者获取一手资讯和每日福利,请扫码添加“深燃小助手”

1caec33c3e0006b9b7af577a7ecdd534.gif

e619fd13eaa3b29b2cd8a21c4fbd24ff.png

6916270909d3933b2bbefe54a6d65f46.png

4fcaf73e85dd7c473ac5270371e41622.png44ce0e9342f16fcbb876f85ef5d7ce9c.pngb675e6282caa9f5b425957088d934089.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6719.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 也能用来造芯,说说英语就可以了?!

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) ChatGPT 真的那么牛吗? 来自纽约大学 Tandon 工程学院的研究人员发布了一篇《Chip-Chat: Challenges and Opportunities in Conversational Hardware Design》论文,用实验回答道…

衔远科技天使轮融资数亿元打造ChatGPT助力企业创新数智化

日前,全球领先的专注于企业创新数智化的技术服务公司衔远科技宣布已经完成数亿元天使轮融资,本轮融资由启明创投领投,经纬创投跟投。 衔远科技成立于2021年底,致力于让每一件商品都应需而生,让每一位消费者都得偿所愿。…

从GPT-1到GPT-4看ChatGPT的崛起

整理了一下ChatGPT的发展历程、背后的技术原理,以及它的局限性在哪。(请注意:有部分内容来自于文内的参考资料,如有兴趣还请阅读原文,本文不构成任何投资建议或者对项目的推荐) *转载请扫码添加后台微信二维…

ChatGPT常用prompts汇总

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

ChatGPT Prompt Engineering for Developers(面向开发人员的 ChatGPT 提示工程)资源汇总

ChatGPT Prompt Engineering for Developers(面向开发人员的 ChatGPT 提示工程)资源汇总 吴恩达老师上新课了《开发者的ChatGPT提示工程课程》。 官网地址: 链接地址为ChatGPT Prompt Engineering for Developers B站中英文字幕视频 01.…

太太太恐怖了!闲来无事测试了一下chatGPT,感觉人类危机要成真了!

太太太恐怖了!闲来无事测试了一下chatGPT,感觉人类危机要成真了!

留学论文写作中引用ChatGPT创建的内容会被允许吗?

【欧洲时报2月28日编译】在智能聊天机器人ChatGPT在全球掀起热潮之际,国际文凭组织(International Baccalaureate,下称IB)近日表示,学生可以在论文写作中引用ChatGPT创建的内容。 英国《卫报》报道,IB是A-l…

玩转ChatGPT:Transformer分类模型

一、写在前面 之前,我们介绍了Sklearn包以及Boost辈的各种分类模型,这些模型都很经典了,实际上也很强大,比如说Xgboost。 然而,近期随着ChatGPT的大火,其底层框架Transformer也逐渐火了,现在大…

ChatGPT进化的过程简介

Chat GPT可以做什么? 分点列条的回答问题 写代码或SQL 翻译 语法检查 ChatGPT官方还未公开论文,ChatGPT有一个“孪生兄弟”InstructGPT,InstructGPT有论文,可以根据InstructGPT论文推导ChatGPT的训练过程: ChatGPT的…

Chatgpt频繁“something went wrong”需要刷新的解决办法

问题描述: 使用Chatgpt问一两个问题或者过一段时间再提问就会出现下图: 需要频繁刷新,很影响体验。 解决办法: 【2023.4.23更新】 目前亲测可用的方法是在edge浏览器(火狐浏览器貌似也可以,chrome不可以…

【视频文稿】车载Android应用开发与分析 - 走进车载操作系统

本期内容的视频地址:https://www.bilibili.com/video/BV1rR4y1B7Qd/ Hello,各位好,我是一个做车载软件开发的软件工程师,之前在CSDN、稀土掘金这些平台上发表过一些车载应用方面的文章,期间得到了许多朋友的反馈。2023…

Midjourney|文心一格prompt教程[Text Prompt(下篇)]:游戏、实物、人物、风景、动漫、邮票、海报等生成,终极模板教学

Midjourney|文心一格prompt教程[Text Prompt(下篇)]:游戏、实物、人物、风景、动漫、邮票、海报等生成,终极模板教学 场景6:游戏 Prompt 真的越长越好吗? 按照 Midjourney 的官方文档里的说法&#xff0…

OpenAI开源3D模型生成器;IBM将推出AIGC平台Watsonx;百度正在内测文心千帆大模型平台丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 OpenAI开源3D模型生成器Shap-E 5月10日,OpenAI公开了其最新的开源模型Shap-E,这款创新型3D模型生成器能将描述性的文本转化为相应的3D模型。用户只需提供描述性的文本,就能生…

美团收购光年之外公司全部业务;工联院对大模型知识问答能力进行评测;图森未来计划出售美国业务;小i机器人发布华藏大模型丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 美团收购王慧文光年之外公司全部业务 6月29日,美团发布公告称:于2023年6月29日(交易时段后)订立交易协议,收购光年之外的全部权益。总代价包括现金233…

13岁青少年DAO创始人:Web3治好了我的“丧”

“我看大家都死气沉沉的,大家都站起来活动活动。” 4月,香港Web3嘉年华的一场沙龙,橙色针织帽给黑压压的现场带来一抹亮色,13岁的Carry Zheng戴着它登台,没有“大家好”的寒暄,直接向台下的成年人发出指令&…

从数据到应用 Web3不再纸上谈兵

继宣布拨款5000万港元加速推动Web3生态圈发展后,香港再次明确对Web3产业创新的支持。近日,香港Web3协会正式成立,创立Web3Hub基金,“东方之珠”正在大力推进第三代互联网的生态建设。 不仅仅是政策红利,ChatGPT等人工…

雷军谈人生低谷,刘强东“卸任”后“整顿”京东,AI 引领技术热潮 | 2022 科技圈那些事...

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 2023 年的钟声已经敲响,回顾 2022 年,新兴技术在蓬勃发展,热点趋势不断出现,在潜移默化中给我们工作、学习和生活带来了许多的变化。 这一…

一周 AIGC 丨全球最大 AIGC 收购案诞生,中国大模型独角兽折戟

同样是在 AIGC 赛道,MosaicML 被 Databricks 以 13 亿美元收购,相比上轮估值翻了 5 倍,创造迄今全球最大的生成式 AI 收购案。而在中国,最耀眼的大模型独角兽光年之外,被以 2.85 亿美元送给了美团,相比两个…

从关键新闻和最新技术看AI行业发展(2023.5.22-6.22第一期) |【WeThinkIn老实人报】

Rocky Ding WeThinkIn 写在前面 【WeThinkIn老实人报】是WeThinkIn的全新栏目,旨在整理&挖掘AI行业的关键新闻和最新技术,同时Rocky会对这些关键信息进行解读,力求让读者们能从容跟随AI科技潮流。也欢迎大家提出宝贵的优化建议&#xff0…

中国芯发展新模式:在高质量、高增长内需中发现机会并建立创新生态

北京华兴万邦管理咨询有限公司 刘朝晖 陈皓 集成电路产业从诞生开始历来都是全球化和生态化的行业。全球化是为了摊销其高额的研发费用和制造成本,以及不低的市场营销(试错)支出;而生态化是因为芯片行业本身并不面向最终用户&…