ChatGPT造孽!中国高校因它算力荒

不做大模型,就没有算力用。

这是ChatGPT点燃AI风口后,国内某top3高校AI实验室的残酷现状。

同一个实验室里,非大模型团队6人用4块3090卡,比起同实验室的大模型团队10个人用10块A800卡,本就已经不算富裕。

现在,校企合作也更偏爱大模型。去年11月ChatGPT发布后,与非大模型团队合作的企业骤减,近期找上门的,也是张口就问:

“你们做大模型不?”

做,有高校和企业的通力支持;不做?那就只能眼睁睁看着算力花落别家。

哪怕某量化私募基金的有10000张A100卡,还对高校研究团队开放申请,也不见得能落一张到你头上。

“要是我们组能分到一些就好了。”看到这条微博,非大模型团队带队的数据科学方向博士小哥羡慕不已,因为缺算力,他都愁得快仰天长啸了:我们也值得投资啊!!!

现在,大伙争先恐后扑向ChatGPT背后GPT-3.5般的各种大模型,算力流向亦然。

其他AI领域本就不足的算力更荒了,尤其是国内学界手里的算力分配下来,贫富差距肉眼可见。

一整个实验室就4块3090卡

巨大规模算力以月为单位的租用成本,对研究团队来说不是小数目。大模型正当其道,学界研究大模型的实验室或团队拥有算力资源的优先分配权

就拿小哥在学校的亲身体验来说,在他们研究室,大模型小组10个人有10块A800卡可用,而另一个研究传统机器学习方向的实验室,整个实验室只有4块3090卡

拥抱主流趋势是一重原因,另一重原因是实验室需要运转和维护的经费,获得拨款的一种形式是申请国家项目,但必要步骤是提供论文成果。

双重原因下,本就不多的算力资源,不得不优先分配给大模型这样热门且相对容易出成果的研究。哪怕对学界来说,训一个大模型其实练不太动——因为数据、算力和资金都有些捉襟见肘。

为了获得更多的资源,有的非大模型实验室甚至额外专门成立研究大模型的团队。

当然,想要获得资金和资源,校企合作也是不可或缺的一种方式。

这种推动产研融合的重要支撑形式持续已久,2020年,KDD中校企合作论文占比超过50%,这个比例在ICCV中达到45%。

举例来说,2021年,清华大学KEG、PACMAN(并行与分布式计算机系统)、NLP等实验室着手推进训练千亿参数的稠密模型,但团队用于训练模型的计算资源并不充足。最终,校外企业智谱AI租用了近百台A100的服务器,免费提供所需算力,这才有了双语预训练语言大模型GLM-130B的诞生。

GLM-130B的任务表现

但在众人争先恐后扑向GPT-3.5般大模型的当下,非大模型团队开始不太好谈这类合作了。

去年11月ChatGPT发布后,与小哥所在团队洽谈校企合作事宜的公司数量急剧减少。在其他高校,AI领域的非大模型团队也总是面临企业询问,“要不要/会不会做大模型”。

本就稀缺的算力,在学界有成为追逐热点的砝码的倾向,算力资源分配的马太效应由此逐渐扩大,带给学术研究很大困扰。

ChatGPT加剧算力分配贫富分化

算力是AI飞速发展必不可少的指标,2018年,OpenAI发布的报告中点出一个算力趋势

自2012年以来,AI训练任务所运用的算力每3.43个月就会翻倍。到2018年,AI算力需求增长了30万倍。

产学研对算力需求暴增,我们能提供的算力有多少?

据中国算力集团统计,截至2022年6月底,我国数据中心机架使用总规模超过590万标准机架,服务器规模约2000万台,算力总规模排名全球第2

这个排名还算不错,但摊开来看仍旧远远不够,毕竟放眼全球,没有哪个国家不是嗷嗷待哺,等着更多的算力资源“投喂”

再退一步讲,买得起显卡,拥有的算力上去了,电费也是天文数字。

况且我国还有特殊情况——

开放原子开源基金会业务发展部部长朱其罡在本月举办的CCF YOCSEF上发言阐述现状称,超算领域的核心技术,一个是IBM LSF超算系统,一个是开源系统。目前,国内多数超算中心都基于开源系统做封装,但这个版本调度资源的效率和能力都有很大的提升空间。

以及,因为众所周知的原因,A100、H100这俩目前性能最强的GPU,还没找到可规模替代的方案。

英伟达A100显卡

综上,算力不够已是积弊,但ChatGPT时代,算力需求剧烈扩张,除了大量训练算力,大量推理算力也需要支撑。

所以现在的情况是,因为ChatGPT显示出大模型的推理能力,训练和研究大模型的算力需求增加;同时因为大模型热度爆棚,蜂拥至大模型的算力资源也增加。

分配给大模型领域的算力资源丰富起来,其他AI领域缺衣少食的情况逐渐加剧,研发能力受到掣肘。

可以说,ChatGPT成为如今的AI届白月光后,加剧了算力分配的贫富分化

这般“富”甲一方的大模型,是不是AI研究路径上最好的?还没人能够回答。

但值得引起注意和重视的是,GPT系列为首的大模型不应该吸引全部目光,整个AI领域还有各种各样的研究方向,还有更加细分的垂直领域,以及带来更多生产力的模型和产品。

当ChatGPT的热度趋于平缓,学界的算力资源分配差距会缩小吗?

所有非大模型方向的实验室和团队,恐怕都在期待之中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5366.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【回答问题】ChatGPT上线了!ChatGPT所有知识截止到了2021年!

【回答问题】ChatGPT上线了!ChatGPT所有知识截止到了2021年,因此2022年的一下技术性知识查不到,但不影响你使用它作为你的百度小助手。 从上面可以看出,chatgpt还是有区分大小写的情况,例如:SLAM

PMCAFF上线ChatGPT回复!

PMCAFF是一个面向产品经理的社区,拥有丰富的文章和问答内容,帮助产品经理提升知识水平和实践能力。此外,PMCAFF还提供了ChatGPT的回复功能,使用户可以在线快速获得回答,提高工作效率。 现在就访问www.pmcaff.com提问&a…

如何用ChatGPT做新品上市推广方案策划?

该场景对应的关键词库(28个): 品牌、产品信息、新品、成分、属性、功效、人群特征、客户分析、产品定位、核心卖点、推广策略、广告、公关、线上推广、线下活动、合作伙伴、资源整合、预算、执行计划、监测、评估、微调方案、价值主张、营销策略、热点话…

各家的“ChatGPT”什么时候能取代程序员?CSDN AI编程榜发布

作者 | 深度999 出品 | CSDN(ID:CSDNnews) “人人都是开发者”的时代终于要来临了! ChatGPT 的出现,引领了科技公司追逐 AI 的浪潮。相比初代 GPT-3,最新基于 GPT 3.5 的模型之所以受到更加广泛的关注&…

ChatGPT为什么不受开发者喜欢?

记得 ChatGPT 最开始上线不久的时候,看到的大部分尝鲜和测试结果都是开发者在做进行敲代码测试,可以说职业危机感非常强的一群人了。 再者,加上 ChatGPT 要使用起来其实是有一些技术门槛的,愿意折腾的人也多是程序员,…

ChatGPT知识库上线俩天,我被攻击了60w次

2023年3月28日,我上线了ChatGPT知识库,结果被攻击了60w次,网站被迫宕机6次。 这是首页的公告。 在编写ChatGPT 知识库的过程中,我一直秉持着公开、分享和进步的理念。 我们相信社会的进步离不开各种形式的交流,一个知…

非常道:ChatGPT 与思想革命

服务器艺术 服务器ART 2023-03-14 17:37 发表于北京 收录于合集#ChatGPT1个 ChatGPT从去年出现到现在,已经变成当今最热的话题,对各个行业尤其是学术界影响非常大,也引出了很多问题。 由此,服务器艺术邀请了不同领域的嘉宾学者&am…

大语言模型会引发第四次产业革命——智能革命吗?

大概盘算了一下,一年多来,业界发布了非常多的大模型,从去年OpenAI GPT-3 1750亿参数开始,到年初华为盘古大模型 1000亿,鹏程盘古-α 2000亿参数,Google switch transformer 1.6万亿;及近期的智源悟道2.0 1.75万亿参数 MoE,快手1.9万亿参数推荐精排模型,阿里达摩院M6 1…

ChatGPT强势爆红,背后的技术原理是?一文轻松搞懂!

什么是ChatGPT? ChatGPT是由OpenAI团队开发和训练一个人工智能聊天机器人程序,换句话说就是专注于对话生成的大型语言模型。在2022年11月30 日OpenAI 的首席执行官Sam Altman在推特上写道:“今天我们推出了 ChatGPT,尝试在这里与它交谈”&…

我与chatGPT的谈话从三个问题开始

chatGPT是什么?xhatGPT为什么那么火爆?chatGPT对我的影响? 首先,chatGPT是什么?以下是它给我提供的答案: 回答的语句通顺,右边还有个反馈按钮,果断给个赞。于是我让他讲述以下自己…

AI 入侵前端,哪类工程师最危险?

整理 | 何苗 出品 | CSDN(ID:CSDNnews) 当 GPT-4 向大家展示了如何用十秒把一个网站的手绘草图变成功能齐全的网站,包括一些炫酷的js链接按钮,技惊四座。不可避免地,前端工程师们也被 AI 风暴卷到了…

最容易被优秀程序员看不起的三件事……

【CSDN 编者按】开发人员们似乎患上了“银弹综合症”,面对技术难关,把太多的期望寄托在所谓的新技术中,却常常低估了一些最基本或许也是最有效的方法。 原文链接:https://nvnh.io/index.php/2022/11/28/3-underrated-things-great…

Chrome 推出全新性能模式,彻底告别“内存杀手”!

整理 | 王启隆 对于许多人来说,每天在电脑上运行着打开大量标签页的 Chrome 进程,可能比运行 3A 游戏大作更加吃力。Chrome 这个“内存杀手”的名号早已是耳熟能详,而谷歌明显也是注意到了这点,开始积极改善这款浏览器的性能。近日…

“AI春晚”北京召开:发布国产开源可商用大模型,OpenAI CEO做主题演讲,LeCun、Hinton都来了...

金磊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT的热度还没减,一场大会又将AI、大模型的注意力推向了新高度。 因为在国内,还从没有哪个活动能如此“高密度”地汇集众多传说中的AI大佬们—— 四位图灵奖得主:Geoffery Hinton、Yann LeC…

大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生

量子位 | 公众号 QbitAI ChatGPT诞生后的第一场全国高考,考生忙,大模型们也很忙。 这不,高考还没结束,AI挑战高考题就成了刷屏热搜话题,各家大模型都被拉出来写起了高考作文,甚至是参与整场考试。 &#…

任正非:过去3年,华为已完成1.3万个美国制裁器件的国产替代!(附:最新讲话实录)...

华为做为5G网络重要供应商,一直以来都是美国几轮出口管制目标,制裁也让华为无法从美国公司获取芯片,也不能利用美国设备来生产、设计自家芯片,拜登政府2022年还禁止在美国销售新的华为设备。 不过,近日,上海…

【观察】星环科技:布局行业大模型赛道,加速国产化替代进程

以ChatGPT和GPT所代表的大模型,已经在国内形成了“海啸效应”,几乎所有的科技公司都在想方设法进入大模型的赛道。背后的核心驱动力,就在于大模型的最大价值在于普遍提升个人生产力,而各行各业的公司都在积极寻找应用大模型和生成…

ChatGLM2-6B发布,C-Eval超GPT4,支持32k上下文!

自清华大学数据挖掘实验室(THUDM)3月开源ChatGLM-6B已经过去了3个多月,最近他们又带来了性能全面提升的“船新”版本-ChatGLM2-6B。别看名字变化小,其实更新的模型性能是又有量又实用。不了解ChatGLM的小伙伴可以看我这篇文章&…

苹果测试Siri自然语言生成功能;腾讯基于语言模型的短文本对话专利获授权;ChatGPT Plus订阅现已在印度推出丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 ChatGPT Plus 订阅现已在印度推出:支持最新 GPT-4 3月17日,据OpenAI官方推特消息,用于访问OpenAI文本生成人工智能的订阅服务ChatGPT Plus已经在印度推出。 OpenAI还继续在其…