ChatGPT软件技术栈解密

ChatGPT 点燃了通用AI浪潮,继农业革命、工业革命、计算机技术革命后,也将可能掀起 AI 技术革命。

业界对 ChatGPT 的 AI 算法关注得比较多,但是 OpenAI 已经演变为服务数亿用户的平台服务。近3个月 ChatGPT 的 SLA 大约99%,也就是说平均每天大约有15分钟不可用,整体技术架构和可靠性也备受关注。

OpenAI 网站近90天状态图

 

OpenAI 网站近90天状态图(绿色表示可用,其它表示异常)

ChatGPT 没有对外正式分享他们的技术架构,所以很难100%准确知道架构大图,本文尝试从以下几个方面:

  • 互联网公开信息(twitter、linkedIn等)
  • OpenAI 最新招聘岗位要求
  • OpenAI 几次故障报告
  • Github 代码

绘制了 ChatGPT 的主要软件技术栈大图。

ChatGPT软件技术栈大图

 

1、云服务

OpenAI 是云时代的 AI 创业公司,所有业务都是架设在公有云上,在创业初期得到 AWS 的支持,下面这个对话是 OpenAI 截止2021年公开信息的回答:

OpenAI 使用了AWS云服务

 

OpenAI 截止2021年公开信息显示使用了AWS云服务

 

上面这段话来自 OpenAI 的官网早期文章介绍,可以看到曾使用了大量 AWS 服务。

近两年又得到微软巨额投资,并且明确了要由 Azure 提供服务。可以肯定 ChatGPT 是在转向以 Azure 为主的多云方案,AWS 服务会逐渐减少。

另外使用了 Terraform 多云管理服务来做云资源的管理。

2、数据库

 

首先问 ChatGPT 自己,基本上都没有明确的答案。不过从官网职位和故障报告可以得到比较准确的信息:

ChatGPT 的核心业务数据保存在关系型数据库 PostgreSQL 中,这个在官方网站有介绍,数亿用户的账号、AK和对话等信息都保存在这里。

2023.2.20号的故障报告也说明了主数据库 PostgreSQL 发生问题。并且提到使用了PgBouncer的连接池服务。

同时使用了 Redis 集群作为缓存服务,在2023.3.20 ChatGPT 爆出了安全漏洞,部分用户可以看到其他人的聊天记录,就是因为踩了 Redis-py 在连接取消状态下会话错乱的 bug,CEO Sam Altman 也在 twitter 出来道歉。

 另外还在招聘中希望懂 CosmosDB,这个目前还不确认用在什么场景,CosmosDB 是 Azure 推出的多模数据库,支持 MongoDB、Cassandra、PostgreSQL、Gremlin 等兼容性接口,是微软在 NoSQL 领域的旗舰产品。

之前 Patrick-McFadin (Cassandra Committer)在 LinkedIn 上提到 OpenAI 使用了 Cassandra,但最终讨论下来是 ChatGPT 自己胡说的,还不能确认是否真的使用了 Cassandra 或者是在 CosmosDB 中使用了 Cassandra 的 API。

另外CosmosDB也通过收购过来的Citus提供的分布式PostgreSQL的接口。不确认是否使用了Citus来完成分布式数据库架构。

ChatGPT 使用了 Snowflake 这个新一代的云原生数据仓库,并且使用了 Tableau 来做数据分析。支持多云部署的 Snowflake 对于业务从 AWS 到 Azure的跨云迁移是非常有利的。

3、前端

在Web前端方面,比较明确的是使用了 TypeScript 语言和 React 框架。

移动端目前 ChatGPT 还没有正式的 APP 发布,不过已经在招聘 iOS 和 Android 工程师,应该快了。

4、应用与服务编程语言

作为以 AI 为基础的科技公司,OpenAI 选择 Python 为核心语言,不管是 AI 岗位还是平台软件工程师岗位,都是需要精通 Python 语言。

平台服务选择 Python,使用了 Python 里比较流行的 Flask 框架,并使用了 OpenAPI 等组件。

5、AI 技术框架

AI 技术框架核心是 Pytorch,可能也使用了 Tensorflow。

OpenAI 自己研发了面向 GPU 的算法框架 Triton,并且在 github 上开源了(
https://github.com/openai/triton),用于代替 NVIDIA 的 CUDA,目标是能更高效的开发机器学习算法。Triton 的编程语言使用了 c++和 python。

关于更细节的 AI 训练和部署服务架构还待挖掘。下图是来自网上陈巍博士分享的一张大模型典型架构图,供参考:

来源:https://zhuanlan.zhihu.com/p/611464068

6、应用部署与监控运维

容器服务:Kubernetes

监控与运维:Prometheues(招聘运维开发工程师提到需要懂PromQL)

日志服务:Splunk

编程语言:Golang、Python

7、参考文档

1. ChatGPT软件工程师岗位描述:

https://openai.com/careers/software-engineer-chatgpt

2. OpenAI 2023.2.20 故障分析报告:

https://status.openai.com/incidents/mq5jgswy45fr

3. OpenAI开源Triton的Github地址:

https://github.com/openai/triton

4. Patrick McFadin在Linkin上讨论ChatGPT是否使用了Cassandra:

https://www.linkedin.com/posts/patrick-mcfadin-53a8046_this-isnt-your-regular-chatgpt-post-so-activity-7031372446536515584-P8fg/?utm_source=share&utm_medium=member_desktop

8、最后

本文作者:叶正盛,NineData 程序员,玖章算术CEO,原阿里云资深技术专家。

NineData 官网:www.ninedata.cloud,提供企业级数据库 SQL 开发工具,数据复制、对比、备份等产品,并提供了类似ChatGPT的SQL服务(SQL AI Copilot),免费使用,无需下载。

欢迎大家留言或者转载!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/1012.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI模式开发ChatGPT软件

hatGPT是由OpenAI开发的语言模型,其开发模式主要基于以下几个方面: 数据收集和预处理:ChatGPT需要大量的语料库来进行训练和学习,因此需要先收集和处理与应用场景相关的数据。 神经网络架构设计:ChatGPT使用了…

超级模型ChatGPT软件开发

要开发一个超级模型ChatGPT软件,您需要考虑以下几个方面: 训练数据:您需要收集和整理大量的语言数据,以用于训练模型。这些数据可以是文本、音频或视频数据。 模型架构:您需要设计一个适合您的数据集和应用场景…

chatgpt软件批量写作软件-文章改编软件

文章改编软件 文章改编软件是一种能够将原有的文本进行复制粘贴后,通过一定算法进行改写和改编的工具。其主要应用领域在于将一些内容复制到网站或博客等平台上时,避免因为重复内容而被识别为“抄袭”,从而提高文章的独特性和可读性。 然而…

chatgpt软件 - chatbox

文章目录 打开github 进入chatgpt官方要记得登录!!点击头像将key命名:安装chatbox下面就可以开始使用啦!! 打开github https://github.com/Bin-Huang/chatbox 特性: 更自由、更强大的 Prompt 能力数据存储…

chatgpt软件代开发系统

ChatGPT软件代开发系统可以按照以下步骤进行: 分析客户需求:根据客户需求,明确软件开发的目标和范围,确定项目需求和开发方案。 设计系统架构:根据需求分析结果,设计软件代开发系统的整体架构和技术…

与机器人chatGPT聊聊软件测试的热门话题

之前我和chatGPT有过一次对话, 那只是问一些有趣的、时髦的大众话题。 上周末在家,想考一考chatGPT的软件测试专业水平,确定它是否算得上一名测试专家?通过一系列有难度的提问,感觉有时它答的精妙与全面,但…

思码逸任晶磊:ChatGPT 时代的软件研发数据与效能提升

思码逸创始人 & CEO 任晶磊在 2023年3月4日于上海举办的 LeaTech 全球 CTO 领导力峰会上作为演讲嘉宾分享了主题为《ChatGPT 时代的软件研发数据与效能提升》的演讲。 💡文字为分享内容的提炼,您可以在文末获取演讲 PPT。 我在清华大学获得博士学位后…

AI免费写代码chatGPT软件Build Software. Fast

AI免费写代码chatGPT软件Build Software. Fast 新版要注册登录(有汉化教程) 文章目录 AI免费写代码chatGPT软件Build Software. Fast1.软件简介2.软件安装3.使用教程1. CTRLK (生成代码)效果2. CTRLL(对话功能) 4. 汉化教程(自带的插件功能&…

开发者福利chatGPT软件Build Software. Fast.

目录 1、软件简介 2、安装教程 3、使用教程 (1)CTRLK(生成代码) (2)CTRLL(对话功能) 1、软件简介 Build Software. Fast.是一款可以在编辑器中使用 openAI GPT-4 模型编写的软件 官网地址:https://www.cursor.so…

chatGPT软件智能开发系统

ChatGPT是由OpenAI开发的人工智能语言模型,可以实现自然语言处理、对话生成等功能。要开发一个类似ChatGPT的软件智能开发系统,可以遵循以下步骤: 确定应用场景:确定软件智能开发系统要解决的问题和应用场景,例如智…

【推荐两款款最近比较火的chatgpt聊天机器人】

推荐两款款最近比较火的chatgpt聊天机器人 智来星球他可以在工作生活方面给你提供相关的帮助微信扫码就可以获取相关的链接 ChatBot聊天机器人这款聊天工具的细分比较多扫码可以查看相关的情况 智来星球 本质是Chatbot GPT-3,也就是比较火的chatgpt 他可以在工作…

保姆级讲解,让ChatGPT成为机器人的智慧大脑

文 / 高扬(微信公众号:量子论) ChatGPT是生成式人工智能,如果能接入机器人,可以让机器人更加智能。 我手上没有硬件,但我们可以模拟尝试机器人的制作逻辑,这个设计分成两部分:硬件、…

部署一个基于ChatGPT的微信聊天机器人以及产生的思考

文章目录 前言功能反响思考 这篇文章主要展示了基于ChatGPT的微信聊天机器人的效果,以及在部署过程中我产生的一些思考。部署一个这样的机器人的具体方法我过两天会单独写一篇文章。 前言 最近几个月以来,ChatGPT这个词语已经像病毒一样在互联网上席卷开…

把盏言欢,款款而谈,当WorkPlus接入了ChatGPT机器人

ChatGPT到底有多火? “谷歌AI聊天机器人出错,市值一夜蒸发7172亿”;“百度类ChatGPT项目‘文心一言’或将直接接入百度搜索”;“阿里确认正研发类ChatGPT产品,目前处于内测阶段”;“网易有道将推出教育场景…

聊天机器人ChatGPT横空出世,今天来看看ChatGPT是如何回答面试官的问题的?

目录 什么是ChatGPTChatGPT回答面试题 在CSDN中向 ChatGPT 提问使用 大家好,我是小冷 ChatGPT热度不断,百度的股票涨了百分数三十多,微软也给对openAI投资了百亿美元。 什么是ChatGPT ChatGPT,是美国“开放人工智能研究中心”研发…

【ChatGPT调教】ChatGPT最强指令、让机器人为你生成机器人!

最近我偶然发现了一条超级牛的ChatGPT指令,可以说是我迄今为止见过的最具商业价值的指令! 这个指令可以让你享受私人定制的服务,也就是利用ChatGPT引导你定制化创建一个专属于你的「智能机器人」,使它能够更好地适应你的业务需求…

王炸!10分钟把ChatGPT部署成24小时微信机器人!

ChatGPT最近大家都是玩的风生水起,不亦乐乎!各种应用层出不穷,其中最接地气,也是最受小白欢迎的就是wx机器人,因为它能跟微信深入融合( 详细看文末专栏 用PythonChatGPT打造超强的微信机器人!),…

零代码基础,一分钟教你快速搭建微信ChatGPT机器人!

微信ChatGPT机器人 1.注册Railway账号:2.部署3. 配置1)点击Configure2)选择仓库地址3)点击安装4)配置信息如下图:5)部署:deploy6) 部署完成:7)微信扫码登录8)…

2023 博客资源网站插入添加chatgpt机器人html源码

最近ChatGPT 实在是太火啦,但是由于是国外网站,门槛有点高,导致很多小白不知道怎么使用。 今天带来一个html版的 它可以插入您的如何博客网站,资源网,属于网站都可以插入,只要是可以插入html代码的&#x…

如何使用自定义知识库构建自定义ChatGPT机器人

目录 隐藏 使用自定义数据源为您的 ChatGPT 机器人提供数据 1. 通过Prompt提示工程提供数据 2. 使用 LlamaIndex(GPT 索引)扩展 ChatGPT 如何添加自定义数据源 先决条件 怎么运行的 最后的总结 使用自定义数据源为您的 ChatGPT 机器人提供数据…