ChatGPT席卷而来,
GPU需求过猛引发缺货涨价潮
【全球云观察 | 热点关注】百度已不是中国第一大桌面搜索引擎,这个消息来自美国数据研究机构Statcounter公布的最新统计数据分析结果。
2023年4月,微软旗下搜索引擎必应(Bing)在中国区桌面端市场份额占比超越百度。这再次将加持了ChatGPT的必应(Bing)推向行业的聚焦点,必应(Bing)在搜索引擎领域加速发展的背后,自然离不开强大AI算力的支撑。
在微软尝到大模型带来的甜头时,针对热火朝天的ChatGPT迭代,各大科技公司也相继在GPT领域加大投入。全球云观察分析指出,AI大模型全球发展虽然很快,但在大模型之争的背后,却隐藏着一场算力的大较量。作为AI算力的顶梁柱,GPU顺理成章成为了畅销货。
当前,高性能GPU供不应求,据证券时报前段时间的消息透露,GPU价格也不断上涨,例如A100 GPU市场单价已达15万元,而在两个月前的价格为10万元,涨幅达到50%。并且A800价格也有明显涨幅,目前价格在9.5万元左右,上月价格为8.9万元左右。
可以断言,GPT席卷而来,对于致力于AI算力云的创新云厂商,也带来了千载难逢的发展机会。在应对AI算力瓶颈的挑战上,需要实现更大的AI算力突破与创新,其核心在于如何赋能模型训练。
对于像微软、谷歌等科技巨头而言,有着雄厚的资本来押注并发展GPT,但是对于广大的企业用户而言,为支持大模型训练,不可能投入数10亿美元来构建AI算力基础设施。在此之前,趋动科技(VirtAI Tech)CEO王鲲分析指出,ChatGPT面向行业化拓展正在呈现出模型变小的趋势。当前ChatGPT正处于“make it perform”的可用阶段,后续必然会走向好用、用得起的阶段,ChatGPT走入“寻常百姓家”也是指日可待。
这一切足以说明了,用户需要更灵活、更弹性、更经济、更便捷的AI算力云来支撑多样化的模型训练。如果可以像使用公有云一样在AI算力云上按需选择,赋能行业的模型训练才会加速普及进度。
要做AI算力界的“顶流者”
凭什么趋动云如此有底气?
在AI算力界,虽然不止趋动云一家在专注,但是要做AI算力界的“顶流者”,趋动云却十分有底气。为什么?
一方面,趋动云背靠趋动科技(VirtAI Tech),也是趋动科技利用其在算力资源池和开发训练平台领域的深厚积累,面向企业、科研和个人AI开发者构建的开发和推理训练服务。成立于2019年的趋动科技,有着其重要的历史使命,通过技术创新与行业积累,实现AI算力普惠,助力人工智能赋能千行百业。
具体而言,趋动云到底是什么?趋动云首席架构师对趋动云做了一个明确的定义,趋动云就是一个“一站式开发训练平台”,用户在这里只需要关注AI开发训练业务本身,而不用关心任何基础设施细节。事实上,用户也无法感知到这些细节,在平台上可以看到的虚拟GPU卡型号也是高度抽象的。其背后的AI硬件的差异和使用复杂性,已完全被趋动云屏蔽。
这样一来,“一站式”的定位,意味着通过为AI算法开发全流程提供优化服务,并构建全球开发者和项目资源分享社区。目前在开发训练场景方面,趋动云可以帮助AI开发者快速而灵活地实现最佳实践。
由此而言,有积累,有用户,趋动云的底气来得顺其自然。不过,同样是做AI算力云的,为啥趋动云就是不一样呢?从趋动云的行业能力与行业价值来看,有着更深入、更专业、更全面、更得道、更实用、更普惠的六大优势,值得一看。
一,不深入,不顶流。
在于趋动云对于GPU资源利用技术方面,不仅实现了多数厂商可以实现的GPU简单虚拟化和任意虚拟化,而且还实现了远程调用等GPU池化技术,进一步实现了更深入的行业落地。
二,不专业,不顶流。
趋动云专注GPU池化云的应用与落地,在行业布局上更注重对AI算力云的用户需求。通过池化算力,提供海量针对不同场景的实例规格,趋动云可以为用户提供高按需的有力保障。
三,不全面,不顶流。
要成为一个变革者,必然就需要和别人不一样。众多GPU算力提供商提供的好比毛坯房,趋动云提供的好比精装房,毛坯房与精装房最核心的区别在于能否“拎包入住”。
“毛坯房”提供者,将用户直接暴露在硬件管理之下,从而带来一系列需要用户关心和解决的事情。比如要申请指定的机器必须懂得硬件调度,要申请指定的GPU卡必须关心算力,要获得相应的管理能力和离线训练能力必须懂得管理环境、数据和代码。这一切迫使用户的数据与应用节点绑定,无法实现管理的灵活性。
“精装房”提供者,趋动云面向AI开发者实行“拎包入住”方式,并且开放大量数据集与源代码集,也已经上线众多模型,做了大量适合AI开发者的“刚需配套”,并且数据集在未来将进一步得到扩展。
四,不得道,不顶流。
这个道就是满足不同类型用户在使用AI算力云方面所需要的灵活性、高效性、与高性价比。趋动云的基因纯正,拥有强大专业的技术团队,得道多助,并已经初步构建起来了趋动云的生态体系。目前前期主要构建AI开发者生态,已经连续多届支持中国大学生计算机设计大赛人工智能应用边缘智能应用挑战赛,积极培养GPU池化模式的未来用户基础。
五,不实用,不顶流。
目前为止,趋动云已经有包括高教、科研、互联网、传媒、医疗在内的诸多企业用户众多个人开发者用户。在发展初期,就能够受到用户的热捧,可见,趋动云采取类似Flink基于公有云的服务方式,有着很强的实用性。
六,不普惠,不顶流。
趋动云从一开始就十分强调高性价比,从GPU池化技术层面实现用户GPU算力资源的高利用率,从而降低应用成本,实现AI应用的普惠。相关测试表明,采用同样模型训练,达到相同精度,目前采用算力池化的趋动云,比公有云成本低60%。
很显然,要做AI算力界的顶流者,普惠AI算力云落在实处,这不仅是趋动云重要的发展底气,而且也是趋动科技肩负的重要历史使命。在AI时代,对任何用户而言,发展的每一步,都来之不易,AI算力的成本优化与效率优化十分重要,也迫切需要。在此,全球云观察分析认为,行业用户的需求驱动,也将进一步加速趋动云的发展与普及。
释放GPU池化技术红利
让AI不只是有钱人玩的游戏
然而,趋动云不仅要做AI算力界的顶流者,更要做AI算力界的创新变革者。
趋动云之所以能为用户提供低成本、高按需保障、无厂商锁定的AI算力,这与其采用了独特的GPU池化技术分不开的。
或许你知道GPU虚拟化技术,或者叫GPU切片技术,但值得注意的是,传统的GPU虚拟化技术基于硬件思维,只能对本地物理机上的GPU进行虚拟切割。而资源池化技术基于整个数据中心范围,不仅可以支持本地资源虚拟化,而且打破单机资源调度的物理边界,让用户透明使用任意物理机上、任意数量、任意品牌厂商的算力资源。
算力池化技术,可以看成是智算领域变革的关键技术,有着从计算时代迈向智算时代的划时代的意义,其带来重要的变革在于两大“解耦”。一是实现用户与硬件进行全面解耦。不仅避免了GPU绑定在某节点服务器带来硬件资源遭遇故障的麻烦与危险。而且用户不需要再关心AI硬件的细节,可以自定义AI算力来匹配业务应用需求,提高整体资源利用率,带来更好的应用成果,加速行业发展。
二是实现CPU与GPU解耦。虽然这对网络要求很高,但AIGC的发展,使得ChatGPT火爆后建立起来的新机房往往会搭建200G甚至更高性能的网络环境。在网络性能足够强的情况下,CPU与GPU解耦合带来的远程性能损耗非常低,用户几乎感受不到。
进一步分析来看,要实现CPU与GPU解耦合,需要理解用户代码怎么使用GPU,在便利性与性能上有所选择,为此可以做API聚合优化,改变用户代码行为,从而让用户体验到实现代码调用性能更高。
据趋动云首席架构师介绍,当前用户采购的是固定支配的GPU服务器,而每个应用需要的GPU卡数不相同,以及需要的CPU和GPU配比也不相同。为此CPU与GPU解耦合之后,GPU池化技术可以充分利用碎片GPU资源,实现不同服务器节点上CPU和GPU资源的整合利用。
趋动云带给用户两大最直接的可见价值,就是便宜和好用。便宜在于趋动云通过GPU池化技术实现了用户AI算力资源灵活取用,打造GPU池化云不仅节约成本,也为用户提高了资源利用率,实现降本增效的目的。相对于公有云GPU资源的包月制,趋动云的按量付费来得更实惠。
好用在于通过云化服务模式,避免了用户对AI算力的运维麻烦。与此同时,趋动云提供结构化管理与多元能力,提升了用户模型训练的便利性。加上趋动云打造越来越丰富的社区资源,带给用户在大模型时代下更开放、更多元的应用价值。无需繁琐的手工配置,可快速基于JupyterLab进行可视化编程,一键式提交离线任务,趋动云的低上手门槛让众多企业玩转AI不再为难。
“让AI不只是有钱人玩的游戏”,通过不断释放GPU池化技术红利,一步一个脚印推动AI算力云走向各个领域,走向行业普及,去满足不同行业不同用户的需要。事实上,趋动云在众多行业领域已经获得了成功落地,比如基于趋动云成功落地的复旦大学MOSS大模型等。
有差异化,才有生存发展空间。在AI算力云的实际需求上,趋动云给予复旦大学等各个行业的用户以“精准扶持”。通常AI训练对只读性能要求高,偶尔也会修改数据集,但公有云很难提供专业化的框架版本能力。因此,AI复现不仅需要算力支持,框架版本、环境配置、预训练模型等方面更需要细致的支持,AI对存储的诉求也非常大,这源于通用存储方案很难满足AI训练的过程,计算高性能带来存储IO瓶颈。在存储上做优化,也可以提升用户AI算力上的应用体验。为此,基于趋动云的存储的能力,趋动云不断开拓生态合作,为用户提供精准的支持。
从用户角度出发,不仅对用户屏蔽硬件细节,让用户只关注业务与自身应用,而且让用户快速实现AI算力配置,可见,趋动云就是一个敏捷个性化的AI算力池化云。
全球云观察分析认为,一个有竞争力的AI算力与一站式开发训练平台服务,价格更美,用起来更美,其核心关键离不开高效价值的运营体系。随着趋动云在科教行业广泛落地,通过大规模的应用实践,对趋动云迈向to B企业级行业领域带来更多的实战经验,同时也进一步打磨趋动云的整体运营体系,敏捷满足用户需求。
针对当前科技巨头发起的ChatGPT大战,AI行业“卷”得越来越厉害,继而诱发智算领域惊现AI大变局,也在催生行业大洗牌。临近一年一度的“618”了,AI算力云价格要不要也“卷”起来呢?为此,全球云观察从趋动云运营总监文禹翔处了解到,在618期间,趋动云也将推出相关活动,敬请到时关注。
连接算力连接人,模型训练就上趋动云。趋动云可以帮助企业开发者、个人开发者和高校科学研究者们提升科研效率,同时有助于AI算法爱好者们降低学习门槛,让爱好者们能更好地接触到最新的前沿深度学习内容,轻松训练自己的第一个模型。
命运对勇士低语:“你无法抵御风暴”。勇士低语回应:“我,就是风暴”。
随着智算领域变革潮来袭,AI算力云有望成为下一个行业风暴,更有魅力的“AI算力池化云”势必会成为这场风暴的风眼。
- END-
你
怎
么
看
?
欢迎文末评论补充!
【全球云观察 | 全球存储观察 |阿明观察 |科技明说】专注科技公司分析,用数据说话,带你看懂科技。本文和作者回复仅代表个人观点,不构成任何投资建议。