GPT-3.5(ChatGPT)训练和部署成本估算

因为ChatGPT(GPT-3.5)未正式公布参数量,暂时按照1750亿参数计算。
后续其他模型公布参数量后,可按参数量线性比例估算相关数值。

以下数值仅为理论估算,可能和实际数值相差很大,敬请谅解。

一、GPT-3.5磁盘占用估算

不同模型之间,磁盘、参数量可以按线性关系粗略估算;
yolov5x:参数量87.6M,磁盘占用166M
175B/87.6M = 1751024/87.6 = 2046
GPT-3.5磁盘占用估算:166
2046/1024 = 332G
所以GPT-3.5模型大小约为332G。GPT-3.5参数量是YOLOV5X参数量的2046倍。

二、GPT-3.5用于推理时显存占用估算

显存占用估算方法参考:https://blog.csdn.net/weixin_49305813/article/details/119179849
显存占用=模型显存(参数)+batch_size×每个样本显存(输出和梯度动量)
GPT-3显存占用:17510244 /1024 = 700G (参数为32float,占4个字节)
需要A100数量:700G/80G = 9块A100
所以,GPT-3.5仅做推理时,空转显存占用约700G,需要大约9块A100(80G)显卡。

考虑用户访问模型:
国信证券测算称,训练阶段每个Token的训练成本约为6N(推理成本为2N)。
根据Similarweb的数据,23年1月份当前ChatGPT日活约1300万人,每人平均1000字左右的问题,因此合计产生约130亿字(173.3亿个token)。假设24小时平均分配任务,需要的算力为
173.3亿21750亿/(51%24小时3600秒)=173000000002175000000000/24/3600/0.51/1000000000000000
=137 PetaFLOP/S
由于访问流量存在峰值,假定访问峰值是一天均值的5倍, NVIDIA 80GB A100 GPU理论算力是 0.312 PFLOPS。
需要A100显卡数量 137*5/0.312 = 2195块
所以,大约需要2195块A100可以满足日活约1300万人访问需求。

三、GPT-3.5训练使用的显卡数量估计

据OpenAI团队发表于2020年的论文《Language Models are Few-Shot Learners》,训练一次1746亿参数的 GPT-3模型需要的算力约为3640 PF-days。
如果是 NVIDIA 80GB A100 GPU, 理论算力是 312 TFLOPS,Megatron 利用 tensor parallel 和 pipeline parallel 并行技术能达到 51.4% 的利用率,也即是每秒能完成 0.160 PFLOPS。
一张A100卡需要跑3640/0.16 = 22750(天)
按照1个月的训练时间计算,需要A100卡数量估计 = 22750/30 = 758 (块)
据悉,训练Meta AI的OPT-175B使用了992张80GB的A100 GPU,每个GPU的算力达到了147 TFLOP/s。
所以,综合以上信息估计完成一次训练,A100卡的用量需求大约为1000块。

四、租赁价格估计

显卡(NVIDIA 80GB A100 GPU)的租赁价格为 1.5 刀每小时
综合上面的访问和训练用A100数量:2195+1000=3195;
还需要考虑并行训练、测试等用卡量,总体按10000块A100估计。
10000块A100一天的租赁费用:10000 * 24 * 1.5 = 360000刀 = 36万刀
注:以上未考虑英伟达对OpenAI的优惠价格。

五、其他机构预测(感觉比较离谱)

3月7日消息,市场调查机构TrendForce公布的最新报告指出,如果以英伟达A100显卡的处理能力计算,运行ChatGPT将需要使用到30000块英伟达GPU。
调查机构TrendForce在报告中指出,预估ChatGPT需要20000块显卡来处理训练数据。随着OpenAI继续在商业上部署ChatGPT和该公司的生成式GPT模型,可能需要超过30000块显卡。
目前英伟达 A100 显卡的售价在10000-15000美元之间,该售价取决于OpenAI需要多少显卡,以及英伟达是否会为AI公司提供订单折扣。TrendForce预估英伟达可以赚取超过3亿美元(IT之家备注:当前约 20.82 亿元人民币)收入。
ChatGPT训练阶段总算力消耗约为3640 PF-days(即1PetaFLOP/s效率跑3640天)。据普超资本微信公众号,GPT-3训练成本预计在500万美元/次。

六、参考

在这里插入图片描述

以GPT-3 175B为例,说明PF-days和flops的等量关系;
3.64E+03 PF-days=3640 * 1000 * 1000* 100010001000243600 = 3.14E+23 次浮点运算

NVIDIA 80GB A100 GPU 理论算力参考:
在这里插入图片描述

Megatron 利用率 参考:
GitHub - NVIDIA/Megatron-LM: Ongoing research training transformer models at scale
在这里插入图片描述

显卡租赁价格参考:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6653.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用ChatGPT写一篇文章

一、MyBatis中一对一关联查询概述 MyBatis是一个Java持久层框架,它提供了简单而强大的数据访问方式。在实际的开发中,我们经常需要查询两个表之间的关联数据,这就需要用到MyBatis的一对一关联查询。本文将介绍如何在MyBatis中实现一对一关联…

使用tailwindcss实现文章的快速排版

Tailwind CSS 是一个功能类优先的 CSS 框架,它集成了诸如 flex, pt-4, text-center 和 rotate-90 这样的类,它们能直接在脚本标记语言中组合起来,构建出任何设计。tailwindcss生产环境非常小,并且一切皆是响应式的。 首先来看一个…

微信公众号文章如何排版?

记得小编在刚开始接触制作公众号文章的时候,最头疼的就是文章的排版了。因为刚开始不懂也不知道该怎么设置字号,字间距,段落格式。也是狠心好好研究了很久才慢慢摸索出来一些经验,这边给大家简单的分享一下文章排班的基本设置吧 首…

ChatGPT专业应用:基于原有文章改写新文章

正文共 611 字,阅读大约需要 2 分钟 市场运营/SEO投放必备技巧,您将在2分钟后获得以下超能力: 自动改写SEO文章 Beezy评级 :B级 *经过简单的寻找, 大部分人能立刻掌握。主要节省时间。 推荐人 | Alice 编辑者 | Lind…

【ChatGPT】写一篇文章《ChatGPT 已成为下一代的新操作系统》,不少于3000字,使用markdown格式。

目录 ChatGPT 已成为下一代的新操作系统 一、ChatGPT 的发展背景 1.1 人工智能的崛起

【Unity】AI实战应用——Unity接入GPT和对游戏开发实际应用的展望

GPT for unity插件地址: GitHub - sunsvip/ChatGPTForUnity: ChatGPT for unity 用法: 打开Unity PackageManager界面.Add package from git URL粘贴插件地址添加 https://github.com/sunsvip/ChatGPTForUnity.git ————————————————————————————…

chatgpt赋能python:Python的优点和用途

Python的优点和用途 Python是一种被广泛应用的动态高级语言,被称为最易学习、最容易阅读的编程语言之一。受到世界范围内开发者的普遍青睐,目前正在不断流行。Python的优点可归纳如下: 1. 可读性强 Python语法简洁,代码可读性高…

chatgpt赋能python:Python常用单词及翻译

Python 常用单词及翻译 Python 是一个使用广泛的高级编程语言,由于其简单易用且功能强大,因此受到了许多开发者的欢迎。在学习和使用 Python 时,我们不可避免地要接触各种技术术语和单词,下面是一些常用的 Python 单词及其翻译。…

python调用chat接口

您可以通过发送HTTP请求来调用ChartGPT的API。以下是一些基本步骤: 1、首先,您需要从ChartGPT网站上获取API密钥。请登录ChartGPT网站,在“Dashboard”下找到“API Key”选项,生成一个新的API密钥。 2、安装Python的requests库。…

chatgpt赋能python:Python连接接口的一些技巧与经验

Python连接接口的一些技巧与经验 Python作为一种强大,灵活,易用的编程语言,被广泛应用于许多领域,包括数据分析,机器学习,数据可视化等等。通过Python连接接口,可以轻松实现不同软件之间的数据…

chatgpt赋能Python-pycharm怎么与python关联

Pycharm怎么与Python关联? 介绍 对于Python开发人员来说,Pycharm是一个非常强大的IDE。它提供了各种工具和功能,用于快速开发和调试Python代码。但是,在开始开发之前,必须将Pycharm与Python关联起来。否则&#xff0…

Python快速接入Chat-GPT(OpenAI)

1、安装openai依赖 pip install openai 2、编写聊天代码 # coding: utf-8 # author: liangshiqiang # date : 2023年04月26日import openaiopenai.proxy http://127.0.0.1:10809 # 翻墙代理 openai.api_key xxxxxxxxxxxxx # openai的keymessages []def add_message(co…

如何使用ChatGPT来自动化Python任务

1.概述 最近,比较火热的ChatGPT很受欢迎。今天,笔者为大家来介绍一下ChatGPT能做哪些事情。 2.内容 ChatGPT是一款由OpenAI开发的专门从事对话的AI聊天机器人。它的目标是让AI系统更加自然的与之交互,但它也可以在我们编写代码的时候提供一…

chatgpt赋能python:Python关联规则分析

Python 关联规则分析 什么是关联规则分析? 关联规则分析是一个数据挖掘技术,通过发现事物之间的相关性来洞察数据背后的规律。其中最常见的就是通过挖掘事物之间的频繁项集和关联规则,来发现商品之间的搭配和规律,帮助商家制定更…

python调用chatGPT的API

前言: 最近一直在研究GPT,LLM,把其他东西都荒废了,随便更新一个,凑个字数。 1.python标准接口使用 python接入chatGPT,用flask封装成API接口,这样你就可以自己把他接入到微信,小程…

chatgpt赋能Python-pycharm关联python

Pycharm关联Python的介绍 Pycharm是一种非常流行的Python集成开发环境,开发人员可以在其中编写、调试和运行Python代码。Pycharm具有许多有用的功能,这些功能可以大大提高代码的效率和质量。其中一个最重要的功能是Pycharm如何关联Python,这…

如何在 Python 开发环境中调用 ChatGPT 模型?

本文将演示在本地的 python 项目中调用 ChatGPT 模型 前言 作为一名程序员,在开发过程当中时常需要使用 ChatGPT 来完成一些任务,但总是使用网页交互模式去 Web 端访问 ChatGPT 是很麻烦的,这时候我们可以使用代码来调用 ChatGPT 模型&…

一个用聊天的方式让ChatGPT写的线程安全的环形List

1. 背景 最近在基于ChatGPT接口写一个聊天机器人,由于官方API未提供直接进行会话上下文关联的方法,因此只能把用户近期的会话信息一股脑的传给过去,并且策略定为:用户最近5分钟的中最多10条对话。为了实现这个要求,考…

基于 ChatGPT API 的划词翻译浏览器插件

OpenAI Translator 需要填入ChatGPT API 浏览器支持划词翻译 参考 openai-translator

和ChatGPT的初次对话

ChatGPT是人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具,使用了Transformer神经网络架构,也是GPT-3.5架构,这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力,尤其是它会通过连接…