部署像ChatGPT这样的大语言模型,到底要花多少钱?

本文来源 AI前线 

作者 | Skanda Vivek  编译 | 刘燕,核子可乐

LLM “经济学”:ChatGPT 与开源模型,二者之间有哪些优劣权衡?谁的部署成本更低?

太长不看版:对于日均请求在 1000 次左右的低频使用场景,ChatGPT 的实现成本低于部署在 AWS 上的开源大模型。但面对每天数以百万计的请求,在 AWS 上部署开源模型则成本更低。(结论适用于 2023 年 4 月 24 日本文撰稿时。)

4350726025b85fb768a693e57071278a.png

用图表比较不同大语言模型间的实现成本

大语言模型正席卷全球。随着 2017 年 Transformers 的推出,BERT、GPT 和 BART 等突破性模型开始陆续亮相,凭借亿级参数在情感分析、问答、分类等语言任务当中带来了前所未见的强大能力。

几年之前,OpenAI 和谷歌的研究人员曾经整理出多篇论文,表明拥有超百亿参数的大语言模型出现了“涌现”能力。简言之,它们似乎能够理解语言中种种复杂微妙之处,并获得了与人类相似的情境反应。

e685671ef969aa638cfd2a70d3fda33a.png

GPT-3 论文称,大语言模型拥有令人印象深刻的学习能力。

GPT-3 论文提到,参数在 10 亿至 1000 亿级别的模型只需几十个提示词,即可展示出令人印象深刻的学习能力。

然而,这些大模型也极耗资源,导致在经济意义上难以实现规模化部署。但这一切随着 ChatGPT 的到来而宣告终结。

就在 ChatGPT 发布后不久,OpenAI 又开放了 ChatGPT API,允许开发人员在自己的应用程序中接入 ChatGPT。

现在大模型的规模成本和经济可行性如何,让我们一起算算这笔账:

ChatGPT API 使用成本

ChatGPT API 的价格随使用方式而变化。其成本为每 1000 个 token 计费 0.002 美元。每个 token 约为一个英文单词的 3/4,就是说,一条请求内的 token 数量等于提示词 + 所生成的输出 token 的总和。

假定大家每天需要处理 1000 个小文本块,每个文本块对应一页文本(即 500 个单词,约合 667 个 token),那么日均成本就是 0.002 美元 /1000x667*1000= 约 1.3 美元。听起来还可以!

但如果每天需要处理上百万份这类文档,情况又会如何呢?那计算下来就是日均 1300 美元,每年约 50 万美元!达到这个规模,ChatGPT 就从酷炫的玩具一下子成了沉重的业务运营负担!(当然,能否靠它赚到更多的钱另说。)

开源生成式模型

在 ChatGPT 赢得众人惊叹之后,一系列开源项目也相继问世。

Meta 发布了 LLaMA ,一个具有数十亿参数的大语言模型,且性能优于 GPT-3。斯坦福随后在 52K 指令遵循演示中对 LLaMA 的 7B 版本做了微调,最终得出的 Aplaca 模型同样胜过 GPT-3。

一组研究人员最近还展示了名为 Vicuna 的 13B 参数微调版 LLaMA 模型,其表现已达 ChatGPT 的九成功力以上。而且企业选择开源生成式模型,而不用 OpenAI 家 GPT 系列模型的理由也有很多。可能是不满于 OpenAI 的服务经常中断,可能是开源大模型更易于定制,也可能是使用成本更有优势。

虽然开源模型可以免费使用,但用于托管和部署模型的基础设施却不可能凭空得来。

BERT 这类早期 transformer 模型倒是可以在装有高配 CPU 和普通 GPU 的个人计算机上轻松运行和微调,但如今的大语言模型却需要更多资源。一种常见的解决方案,是使用 AWS 等云服务商托管和部署这类模型。

那么,免费的开源模型在 AWS 那边到底会产生多少成本?

AWS 成本分析

首先,我们得先明确部署模型并以 API 的形式开放服务所对应的 AWS 标准架构。这通常分为三个步骤:

  1. 使用 AWS SageMaker 将模型部署为端点。

  2. 将这个 SageMaker 端点接入 AWS Lambda。

  3. 通过 API Gateway 将此 Lambda 函数开放为 API。

d0bbd6e169695e599796f13f62a03262.png

使用 API Gateway 加 Lambda 调用 SageMaker 模型端点。

当客户端对 API Gateway 执行 API 调用时就会触发 Lambda 函数,并在完成函数解析之后将其发送至 SageMaker 端点。之后由模型端点执行预测,把信息发送至 Lambda。Lambda 再做解析,将结果发送至 API 并最终返回至客户端。

SageMaker 的实际成本往往直接取决于用于托管模型的计算实例类型。大语言模型体量可观,自然要用到容量极大的计算实例。

0ff94b162c2680d044eda9c885fd98c1.png

各种 SageMaker 实例类型价格表。

例如,AWS 就专门发布一篇教程,介绍了如何部署一套包含 200 亿参数的 Flan UL2 模型。

文章中使用的是 ml.g5.4xlarge 实例。虽然上表的 SageMaker 定价并没有列出这个特定实例的价格,但粗略估算成本大约在每小时 5 美元左右。这就相当于每天 150 美元上下!而且这还只是托管实例的部分,我们还没算上 Lambda 和 API Gateway 的费用。

下面来看 AWS Lambda 部分的成本,它的价格由内存用量和请求频率决定。

e9aafc9aecdb05ff2b117f145b6e72ca.png

AWS Lambda 价目表。

假定 5 秒之内向用户返回响应即可,那么考虑到将数据路由至 AWS SageMaker 端点的需求,128 MB 内存就够了。这样对于每 1000 条请求,成本为 5*.128*1000*0.0000166667 美元 = 0.01 美元。如果按 100 万条请求计算,则费用为 10 美元。

最后是 API Gateway 部分的成本:

a482789644bc9808dde2060c3eb9e733.png

AWS API Gateway 价目表。

如大家所见,API Gateway 倒是非常便宜,每百万条请求只需 1 美元。

也就是说,在 AWS 上托管像 Flan-UL2 这样的开源大模型,每天 1000 请求时的成本为 150 美元,每天 150 万请求则为 160 美元。

但我们有必要选择这么昂贵的计算实例吗?对于像 BERT 这样亿级参数的小语言模型,选择 ml.m5.xlarge 这类更便宜的实例就足够了,其每小时成本仅为 0.23 美元,全天只合约 5 美元。与所谓能够理解语言中细微差别的大模型相比,这些小模型也已经相当强大,还能针对特定任务和训练数据进行微调。

写在最后

那么,到底是商用大模型好还是开源大模型好?OpenAI 的 GPT 家族到底有没有性价比?最终答案还是要看大家的实际需求:

ea9bfb18fd5a6f56922121de83edcb48.png

付费服务模型的优势和短板。

da3aae690b5ee9a9acf63942ae0cbf54.png

开源大模型的优势和短板

注意:因为这个领域仍在快速发展,所以在规模化需求的推动之下,大语言模型的部署成本很可能会快速下降。而且虽然开源大模型的托管比较复杂,但像 BERT 这类亿级参数的小语言模型在特定任务上仍是个很好的选择。

从性能上看,ChatGPT 和 GPT-4 的响应质量确实比开源大模型强一些。但开源模型阵营也在迎头赶上,所以我们将有越来越坚定的理由选择这一派。

首先,企业希望根据特定数据源对开源模型做微调。在经过针对性微调之后,开源模型的性能往往会反超专为通用场景打造的 ChatGPT 及其他 OpenAI 后续模型。事实证明,BloombergGPT 等领域特定模型已经成为生成式 AI 世界中一股不容忽视的重要力量。

最后,希望 OpenAI 不会进一步提高 ChatGPT API 的价格。毕竟跟早期的 GPT-3 API 相比,ChatGPT API 在亮相之初就把价格压到了十分之一的水平,但愿 OpenAI 能继续保持住这样的优良传统。

原文链接:

https://towardsdatascience.com/llm-economics-chatgpt-vs-open-source-dfc29f69fec1

猜您喜欢:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

深入浅出ControlNet,一种可控生成的AIGC绘画生成算法! 

经典GAN不得不读:StyleGAN

2fa4f85c4a2e79cbb4ced9a9855dabeb.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

c1753763476a399b009ad694aa1ba57a.jpeg

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/2882.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

震撼揭秘:ChatGPT流式返回的黑科技,颠覆您的交流世界!

点击上方“阿三先生”↑↑↑关注我 开发在使用gpt的过程中,我们知道gpt的响应是很慢的,如果是商用过程中,会使用户等待不耐烦,直接放弃产品。在对话过程中,及时的交互是很有必要的。 所以我们可以使用gpt的流式进行响…

如何用ChatGPT制作PPT?

作为程序员的我们,还在为不会写PPT述职报告而烦恼吗? 别担心!!让ChatGPT来帮我们吧!! 你只需要对只ChatGPT说:“嘿,请帮我写一份PPT演示文稿”,等待10秒ChatGPT即可帮我…

借助国内ChatGPT平替+剪映/百度AIGC平台快速制作短视频

系列文章目录 借助国内ChatGPT平替MindShow,飞速制作PPT 借助国内ChatGPT平替markmap/Xmind飞速生成思维导图 利用ChatGPT编写Excel公式,对比讯飞星火与ChatGPT对Excel公式的回答 文章目录 系列文章目录前言一、科大讯飞“星火”认知大模型二、使用步…

如何用ChatGPT, 每天自动批量产出100+条爆款短视频

​关注 很多小伙伴不知道怎么生产内容和制作内容,今天我针对当前比较火的短视频平台(抖音、快手、视频号等),分享一个利用ChatGPT快速生产内容的方式。 需要批量制作的视频需要解决两个问题:大量选题及脚本内容、自动…

让ChatGPT帮你写一个短视频脚本是什么体验?

很多网红博主以及各个领域的短视频博主都在使用的“AI编写视频脚本”,效率直接提升20倍↑↑↑!很多自媒体平台对于ChatGPT的介绍很少,但是他们都在悄悄利用这个强大的AI来帮助处理工作。关于“如何利用ChatGPT编写视频脚本”这件事&#xff0…

ChatGPT可以做WebRTC音视频质量性能优化,惊艳到我了

摘要 随着GPT-4的发布,AI的风越吹越旺。GPT-4可以回答问题,可以写作,甚至可以基于一张草图生成html代码搭建一个网站。即构社区的一位开发者倪同学就基于目前在研究的WebRTC QoS技术点对GPT-3.5跟GPT-4进行一场实验,ChatGPT会取代…

通过 ChatGPT 制作一个短视频

图文,生成视频 当通过 ChatGPT 生成连贯的 prompt 时,除了连环画,我们理所当然还可能畅想更激进的场景——生成动画视频。目前 AIGC 社区确实在生成视频方面有一定的尝试。比如 Deforum 可以通过多条 prompt,配合具体的切换时间点…

基于ChatGPT的视频智能摘要实战

随着在 YouTube 上提交的大量新视频,很容易感到挑战并努力跟上我想看的一切。 我可以与我每天将视频添加到“稍后观看”列表中的经历联系起来,只是为了让列表变得越来越长,实际上并没有稍后再看。 现在,像 ChatGPT 或 LLaMA 这样的…

使用ChatGPT打造短视频爆款开头, ChatGPT联网啦, 可以直接播放周杰伦的音乐

牙叔教程 简单易懂 第一步 采集爆款开头 采集短视频开头文案的教程之前已经写过了, 不会的看这个 某音如何自动化采集爆款开头-黄金5秒 对录制音频的建议 时间间隔在5秒左右 网易见外输出格式: srt字幕 备注 srt字幕输出后, 网易见外支持在线编辑字幕 提取出的文案开头…

如何让ChatGPT你写一个短视频脚本

很多网红博主以及各个领域的短视频博主都在使用的“AI编写视频脚本”,效率直接提升20倍↑↑↑!很多自媒体平台对于ChatGPT的介绍很少,但是他们都在悄悄利用这个强大的AI来帮助处理工作。关于“如何利用ChatGPT编写视频脚本”这件事&#xff0…

如何使用ChatGPT帮助生成YouTube视频摘要?这个插件做到了!

最新在YouTube上看一些教程视频,有的视频时间较长,必须要花费很长时间去看,很浪费时间,同时也是很让人烦恼,但是我发现了一款特别好用的Chrome插件: YouTube视频摘要生成器-一键复制ChatGPT(中文版) 真是一…

保姆级教程,一分钟学会利用ChatGPT制作短视频

1. 概述 ChatGPT的名字相信大家并不陌生,不熟悉的朋友可以查看我以前的文章了解一下。今天我们来谈谈一个更通俗易懂的教程。这个教程将教你如何使用ChatGPT快速制作短视频,操作简单,容易上手。 在各大平台上,你可能看过很多使用…

【ChatGPT实践篇】给小孩制作一个数字人恐龙科普短视频

以下文章来源于飞书 1 科普文本生成 起初我也是试了不少prompts去让chatgpt自由发挥,生成恐龙科普文章,但科普内容要么过于复杂,要么过于宽泛,无法到达自己想要的效果。 既然如此,我决定定制化科普内容,…

【使用心得】2023版本ChatGPT做短视频编导

使用Chat GPT后,我发现它除了提供生活、学习等实用的信息外,还具备成为一位专业短视频编导的素养。在对剧情和拍摄技巧有诸多需求时,它给予我充分支持和建议,并以自身智能的特点让我快速了解每一个步骤。 Chat GPT可以提供广泛的短…

ChatGPT基本玩法

ChatGPT是一种基于大规模预训练的语言模型,可以用于各种自然语言处理任务。其基本玩法是使用预训练的模型来生成文本,可以用于对话生成、文本摘要、机器翻译等应用。下面我们来看一些具体的案例: 对话生成 ChatGPT可以用于对话生成任务&…

跟ChatGPT玩狼人杀,人类一败涂地

“如何用ChatGPT玩狼人杀?” UP主LUMO_Xu 突发奇想。为了解答这一问题,他做了一场大型实验。 自从ChatGPT问世以来,对于ChatGPT离谱的能力,网友们早已见怪不怪。 在B站,关于ChatGPT各种神奇用法的视频,更是…

将ChatGPT玩溜,玩赚自媒体

文 / 韩彬(微信公众号:量子论) 昨天用ChatGPT回答的关于“养猫”的话题,25个阅读,有1个喜欢,说明质量略好,但还要继续改进。 昨晚在研究OpenAI的最新模型GPT-3.5 Turbo的API,准备通过…

与ChatGPT玩文字冒险游戏[寻五宝石]

注:文中的图片来自另一个AI生成图片的程序。 我: 请重新开始一个文字冒险游戏。由你来描述游戏场景(盗墓情节),由我来决定采取的动作。请详细描述场景中所有的物品、生物。 如果场景中的人物在对话或者跟主角对话&…

ChatGPT 玩「脱」了,写了份毁灭人类计划书,还遭到了 Stack Overflow 的封杀.........

【CSDN 编者按】OpenAI 的新通用聊天机器人原型 ChatGPT 可谓是风靡一时,但却突遭 StackOverflow 封禁。 整理 | 刘春霖 责编 | 张红月 出品 | CSDN(ID:CSDNnews) 在上周发布的《挑战 Google 搜索?OpenAI 发布最…

ChatGPT玩法大全火了,一键复制就能get同款效果:脱口秀张口就来,还能扮演哈利波特...

点击上方“视学算法”,选择加"星标"或“置顶” 重磅干货,第一时间送达 Pine 发自 凹非寺量子位 | 公众号 QbitAI 正值风头的“网红”ChatGPT在过去一周算是被网友们玩坏了! 各种有的没的玩法都被网友们发掘出来了…… 比如说就有网…