文|张向前
源|分布式实验室
OpenAI的新业务模式,卖Model instance,起价26万4千美元一年。
这个Model instance的好处是它完全归属于你,你可以按照自己的要求,对它进行有针对的微调,使它具备你需要的专业能力。可以理解为OpenAI提供通用基础脑,而客户可以把它改成专业脑。
由于基础模型的功能已经足够强大,对它进行改造的成本很低,所以企业无需自己从头训练一个大型LLM,直接在OpenAI的基础上微调就能得到自己的模型。
OpenAI悄悄启动了一套全新开发者平台,允许客户使用专用容量运行OpenAI的新型机器学习模型,包括GPT-3.5。根据用户在Twitter上亮出的早期截屏画面,OpenAI即将发布的这款产品名为Foundry,号称“专为运行更大工作负载的顶级客户而设计”。
文件指出,“Foundry能够支持大规模推理,用户可以完全控制模型配置与性能设定。”我们已经联系OpenAI以确认这条消息是否准确可靠。
如果截屏内容可信,那么在启动之后,Foundry将专门为单一客户提供“静态分配”的计算容量(可能由OpenAI的首选公有云平台Azure提供)。这样,用户就能使用OpenAI内部的模型构建和优化工具/仪表板,对特定实例开展监控。此外,Foundry还会提供一定程度的版本控制,由客户决定是否升级到更新的模型版本,并为OpenAI的新模型提供“更健壮”的微调。
Foundry还将提供服务水平承诺,例如正常运行时间和按期工程支持。这些专用计算单元要按季度或年计算租金,运行单一模型实例需要租用特定数量的计算单元(详见下图)。
可以肯定的是,这类实例不会太便宜。即使是GPT-3.5的轻量化版本,三个月期的运行费用也高达7万8千美元;一年期承诺合约的运行成本为26万4千美元。作为对照,英伟达最新一代超级计算机DGX Station的每单元运行价格为14万9千美元。
敏锐的Twitter和Reddit用户们已经发现,实例定价表中列出的文本生成模型之一具有32K的最大上下文窗口(所谓上下文窗口,是指模型在生成其他文本之前所能考虑的背景信息;上下文窗口越大,则代表模型能够「记住」之前的更多文本内容)。OpenAI的最新文本生成模型GPT-3.5具有4K最大上下文窗口,这暗示着此处的新模型很可能是大家期待已久的GPT-4——或者说3.5到4.0之间的某个过渡版本。
从微软获得数十亿美元的投资之后,OpenAI目前正背负着巨大的盈利压力。根据报道,该公司预计将在2023年赚到2亿美元。但截至目前,这家初创企业的研发投入已经砸下10亿美元。
这笔开销大部分来自计算成本。对于前沿AI模型的训练而言,瞬间就会烧掉几百万美元,后续的推理运行也不会便宜太多。根据OpenAI联合创始人兼CEO Sam Altman的介绍,OpenAI如今爆火的聊天机器人ChatGPT在处理每次会话时成本为几美分。考虑到早在去年12月,ChatGPT的用户就已经超过百万,这部分运营成本也绝对不容小觑。
在AI货币化的过程中,OpenAI最近还推出了ChatGPT的“Pro”版——ChatGPT Plus,每月起步价20美元。他们还与微软合作开发了Bing Chat,在争议声中迅速获得主流关注。根据相关消息,OpenAI未来还计划推出移动版ChatGPT应用,并将其AI语言技术引入Word、PowerPoint和Outlook等微软产品。
另外,OpenAI将继续通过微软Azure OpenAI服务(一套以企业为中心的模型服务平台)进行技术交付,并维护与GitHub合作开发的付费代码生成服务Copilot[1]。
后台回复关键词【入群】
加入卖萌屋NLP、CV、搜推广与求职讨论群
[1]https://mp.weixin.qq.com/s/rAxz1qacC2Tuo2Nnigvc_g