chatGPT大规模使用kubernetes,云原生技术在AI领域也大有可为

文章目录

      • 一、云原生在AI领域的应用方向
        • 1.1、弹性部署
        • 1.2、自动化和可维护性
        • 1.3安全性和隔离性
      • 二、云原生在AI领域的应用案例
        • 2.1、chatGPT全面使用云原生技术
        • 2.2、TensorFlow Serving和k8s及docker的集合
        • 2.3、AWS SageMaker
      • 三、云原生AI开发平台的发展

公众号: MCNU云原生,文章首发地,欢迎微信搜索关注,更多干货,第一时间掌握!
最近ChatGPT引爆了人工智能,除了人工智能,其他技术好像偃旗息鼓了。那人工智能的时代,云原生扮演什么角色呢?实际上随着人工智能技术的不断发展,云原生技术已经成为AI领域中不可或缺的一部分。云原生技术可以帮助开发人员更高效地构建、部署和管理AI应用程序,从而实现更好的性能和可靠性。本文将探讨云原生技术在AI领域的应用方向、应用案例以及云原生AI开发平台的发展。

一、云原生在AI领域的应用方向

云原生在AI领域其实也有很多的应用方向,最突出的是弹性部署、自动化和可维护性、安全和隔离。

1.1、弹性部署

云原生技术提供了一种弹性和可扩展的方式来构建和部署AI应用程序。开发人员可以根据需要添加或删除资源,以适应不同的工作负载。这种灵活性可以确保应用程序在任何情况下都具有最佳的性能和可靠性。

我们知道LLM(Large language Model )模型的训练和推理都需要大量的部署训练和推理应用节点,AI的训练是非常消耗资源的,这就更加需要“弹性”,根据实际需要动态调整应用程序的部署,而这明显是云原生的强项。

1.2、自动化和可维护性

云原生技术可以自动化许多与应用程序部署和管理相关的任务。例如,自动化部署、自动化扩展和自动化恢复。这种自动化可以大大减少人工干预,提高应用程序的可维护性和可靠性。

大规模的AI应用程序一般都是分布式部署,协同工作,应用程序部署扩展、失败维护等都是日常稀松平常的操作,但是动辄几千上万的应用,如果没有自动化的能力,靠人工的话,那可就违背“人工智能”的初心了。

1.3安全性和隔离性

AI应用程序通常需要访问敏感数据,因此安全性和隔离性非常重要。云原生技术可以提供一系列安全措施,如访问控制、加密和隔离,以确保数据的保密性和完整性。

二、云原生在AI领域的应用案例

2.1、chatGPT全面使用云原生技术

Openai官方博客介绍了chatGPT使用云原生技术支持模型的训练的。官方表示openai已将 Kubernetes 集群扩展到 7500 个节点,为GPT-3、 CLIP和 DALL·E等大型模型提供了可扩展的基础设施 ,同时也为神经语言模型快速小规模迭代研究提供了基础设施。

ChatGPT通过将其代码和依赖项打包成容器来进行部署和管理,容器化技术可以使ChatGPT应用程序在不同的环境中运行,而不会受到环境差异的影,同时Kubernetes提供了强大的容器编排和管理功能,可以自动化部署、扩展和管理应用程序。

ChatGPT的部署和运维是自动化的,可以通过持续集成和持续交付(CI/CD)流水线来实现。这种自动化技术可以使ChatGPT应用程序的部署和管理更加可靠和高效。另外ChatGPT应用的部署可以根据负载的变化自动调整其资源使用量,以实现弹性伸缩。

从官方博客介绍,chatGPT项目的监控也采用了云原生的相关技术,典型的使用 了Prometheus 收集时间序列指标,使用 Grafana 实现了图表、仪表板和警报。

2.2、TensorFlow Serving和k8s及docker的集合

TensorFlow Serving是一个基于云原生技术的开源软件,用于部署机器学习模型。它可以自动化处理模型版本控制、模型部署、模型监控和模型更新等任务。TensorFlow Serving可以自动化实现机器学习模型的部署和管理,使开发人员可以更专注于模型的训练和优化。

使用TensorFlow Serving的最好的方法是使用Docker镜像,能够非常简单的使用Docker Swarm和kubernetes部署TensorFlow Serving。

可以不管上层的模型框架如何变化,云原生技术都能够作为一些设施能力让这一切变得更加丝滑。

2.3、AWS SageMaker

AWS SageMaker是一种云原生的机器学习开发平台,可以帮助开发人员快速构建、训练和部署机器学习模型。它可以自动化处理许多与机器学习开发相关的任务,如数据准备、模型训练和模型部署。AWS SageMaker还提供了一系列可视化工具,以帮助开发人员更好地了解和优化模型性能,这一切都是向云而生的。

三、云原生AI开发平台的发展

除了以上的案例之外,有另外一个明显的趋势已经形成,那就是云原生AI开发平台。这一趋势正在加速,国内和国外的技术大佬和资本圈大佬都在往这个方面发力。

云原生AI开发平台指的是把云原生技术和平台与AI 应用相结合通过相应的技术配套和长期工程实践,来满足AI业务场景。

虽然类chatGPT的应用如火如荼,但是很多公司在实际使用大语言模型的时候却面临诸多的困难,例如资源投入太大、模型训练困难、周期长等等。而云原生AI开发平台正是为了解决这个问题。

未来将能够在云上开发AI应用,训练垂直领域的独特模型,有限的资源投入就可以看到一定的效果。例如在云上进行NLP超大模型训练,智能营销以及自动驾驶的应用,AI训练的速度、开发应用的速度都会大幅提升,成本将能够大幅下降。(这直接决定了企业愿不愿意投入研究)

云服务厂商纷纷推出自己的云原生AI平台和解决方案,例如百度的AI-Native架构实现AI一体化云服务,阿里的云原生AI解决方案全面支持GPU和CPU异构调度,腾讯云推出AI Paas服务等等。这些厂商都推出了全方面的解决方案,把云原生平台的能力和AI的能力结合在一起,共同提供服务。


(图片来源于艾瑞咨询报告)

云原生AI开发平台有以下的优势:

  1. 多云支持

    云原生AI开发平台将能够屏蔽实现多云支持,可以使企业更加灵活地管理和部署他们的AI应用程序,并在需要时快速迁移应用程序到其他云平台。

  2. 弹性计算

    能够根据当前的AI应用的工作负载自动弹性调整资源的使用量,优化成本和资源利用率。

  3. 自动化部署和管理

    云平台自动化部署和管理,由平台解决大部分的管理操作,部署简便,节省大量人力。

  4. 模型和训练数据集管理

    AI时代,模型的训练需要大量的数据集,需要有模型的管理和数据集的管理功能,例如目前火爆的hugging face,云原生的AI平台要具备相关的管理功能。

  5. 屏蔽底层异构架构

    云原生AI开发平台底层支持各种基础硬件,例如GPU、NPU、CPU等,支持对应的异构框架如英伟达的cuda、昇腾的CANN,支持多种计算框架和机器学习框架,如tensorflow、pytorch等,尽量屏蔽底层硬件和框架的差异,减少使用困难。

相信随着AI的快速发展,云原生也会迎来属于它新时代的辉煌。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10658.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

与chagpt对话记录

每日chagpt对话记录 关注我一下 vscode 浏览器版本 c 函数 无法跳转 C/C IntelliSense, debugging, and code browsing. C/C IntelliSense、调试和代码浏览是指在使用VS Code进行C/C开发时的一些核心功能。下面是对这些功能的简要说明: IntelliSense(智能…

使用 ChatGPT 碰到的坑

最近在使用 ChatGPT 的时候碰到一个小坑,因为某些特殊情况我需要使用 syslog 向 logbeat 中发送日志。 由于这是一个比较古老的协议,确实也没接触过,所以就想着让 ChatGPT 帮我生成个例子。 原本我已经在 Go 中将这个流程跑通,所…

ChatGPT帮你调用PID算法【结合代码】

目录 PID算法是一种控制算法 下面分别介绍PID算法中的三个参数 MATLAB代码实现PID MATLAB代码实现PID PID算法是一种控制算法 用于控制系统的稳定性和精度。PID算法的名称来源于其三个组成部分:比例(P)、积分(I)和微…

ChatGPT实战之PID算法实现

让chatgpt写一段pid控制算法,看看效果如何。 通过调参也能实现收敛了。实际应用还是要看你具体的需求了。 话不多说上代码: import matplotlib.pyplot as plt import numpy as np class PositionPID(object): “”“位置式PID算法实现”“” def __ini…

Qt:依据ChatGpt生成Qt可选择扇形按钮

目录 引言1、生成过程1.1 饼图2.2 扇形图3.3 可选择扇形按钮1.4 新的扇形画法*GraphicItem 2、训练过程3、错误原因4、涉及知识点 引言 因为项目需要绘制一个中间为圆心,包含数个扇形的可选择按钮。正好ChatGpt使用起来比较成熟,因此使用询问的方式得到两…

五分钟零基础开发chatgpt+Midjourney工具赢得被动收入

首先感谢laf提供免费使用Midjourney API接口和云函数,需要详细了解的可以访问他们的官网论坛。 感谢论坛前面几位的分享,我做了参考。都有参考就不列啦哈!!! 直接开始: 第一步 复制MJ-SEND云函数到laf云…

chatgpt赋能python:Python短信通知:简单高效的实现方式

Python 短信通知:简单高效的实现方式 现在,随着移动互联网的飞速发展,越来越多的企业和个人开始利用短信来进行通知、推广等操作。Python 作为一门广泛应用于 Web 和数据领域的编程语言,也可以通过一些简单的 API 接口&#xff0…

chatgpt赋能python:Python如何接收短信?——详细介绍,并提供实用代码

Python如何接收短信?——详细介绍,并提供实用代码 短信已经成为了我们日常生活中不可或缺的一部分。在很多行业中,短信通知也被广泛应用,如金融、教育、医疗等等。那么,如何在Python中实现接收短信呢?在本…

人工智能之读懂CNN卷积神经网络

通过往期文章的分享,我们了解了神经网络的结构,一般分为输入层,隐藏层,输出层 TensorFlow神经网络 那什么是卷积神经网络那,这就要我们追溯一下人类识别图像的原理 人类的视觉原理如下:从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现…

人工智能CNN 卷积神经网络结构(tensorflow代码实现)

MNIST是一个简单的视觉计算数据集,它是像下面这样手写的数字图片: MNIST 通过上期的分享,我们了解了手写数字识别的基本原理以及CNN卷积神经网络的基本原理,本期我们结合MNIST数据集,来用代码来实现CNN。(手写数字识别是TensorFlow人工智能最基础的案例,这个跟学习编程…

基于深度学习的图像分类:使用卷积神经网络实现猫狗分类器

摘要: 深度学习在计算机视觉领域中具有广泛的应用。本文将介绍如何使用卷积神经网络(CNN)实现一个猫狗分类器。我们将使用Python和TensorFlow框架搭建一个简单的卷积神经网络模型,并利用猫狗图像数据集进行训练和测试。通过本文&a…

6种卷积神经网络压缩方法

点击上方“AI遇见机器学习”,选择“星标”公众号 第一时间获取价值内容 来源:机器学习杂货店 本文约5200字,建议阅读10分钟 我们知道,在一定程度上,网络越深,参数越多,模型越复杂,其…

超简单的卷积和加法融合,伪代码版

原创文章请勿随意转载,如有需要,请于作者联系。 前几天写了一个卷积神经网络(CNN)中,卷积和加法融合的文章。有同学问,希望写一个带代码版本的,方便更好的理解。 我的第一反应是,代…

【深度学习NLP】基于卷积神经网络(CNN)实现中文文本情感分析(分类)附代码以及数据集链接

【注】:本文所述的实验的完整实现代码包括数据集的仓库链接会在文末给出(建议读者自行配置GPU来加速TensorFlow的相关模型,运行起来会快非常多) 目录 一、研究的背景和目的 二、文本数据集描述 1、数据集来源以及使用目的 2、数据规模、以及如何划分…

Stability AI 创始人:大模型不应该只属于巨头

作者 | 凌梓郡 编辑 | 靖宇 追溯 ChatGPT 引发的 AI 军备竞赛,可以回到去年 7 月,图像生成模型 Stability Diffusion 开源(下文称 SD)。这个在 Open AI 的绘画模型 DALL- E2 之后发布的模型,因其源代码开源&#xff0c…

谷歌员工担心自家 AI 敌不过 ChatGPT,高管回应:其过快发展可能损害公司

来源:AI前线 整理:冬梅、核子可乐 谷歌的 Jeff Dean 表示,一旦提供错误信息、大企业所面临的“声誉风险”要比小公司更严重,所以谷歌自然“比小型初创公司更加保守”。 自 11 月底以来,AI 聊天机器人 ChatGPT 正式向公…

我让Chat GPT准备了几份SAP 顾问英文面试自我介绍的模板,大家感受一下

有个朋友说有个面试要用英文来做自我介绍,我灵机一动,不如让Chat GPT准备了几份SAP 顾问英文面试自我介绍的模板,大家感受一下。我看下来感觉写的还是中规中矩,可以一用,。 模板1 Sure, I can help you with that! Her…

从语言模型到ChatGPT:大型语言模型的发展和应用

前言 为获取最佳阅读格式体验,建议访问个人博客:从语言模型到ChatGPT:大型语言模型的发展和应用 | JMX Blog 大型语言模型(LLM)是指能够处理大量自然语言数据的深度学习模型,它已经在自然语言处理、文本生…

OpenAI2022年亏损5.4亿美元;GPT-4等大模型容易导致侵权和社会偏见问题;学而思研发大模型MathGPT丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 携程集团与亚马逊云科技成立联合创新实验室 日前,亚马逊云科技宣布与携程集团共同成立“联合创新实验室”,双方表示联合创新实验室将探索运用云计算、大数据、人工智能和机器学习等前沿技…

云原生周刊 | 使用 ChatGPT 协助解决 Prometheus 告警

开源项目推荐 kubernetes-chatgpt-bot 这是一个适用于 Slack 的 ChatGPT 机器人,只要有监控告警发送到 Slack 频道中,你就可以通过机器人向 ChatGPT 咨询如何解决这个告警,ChatGPT 将会给出一个较为详细的解决方案。 Copacetic Copacetic …