谷歌云| 5 个 GKE 功能可帮助您优化集群

Cloud Ace 是谷歌云全球战略合作伙伴,拥有 300 多名工程师,也是谷歌最高级别合作伙伴,多次获得 Google Cloud 合作伙伴奖。作为谷歌托管服务商,我们提供谷歌云、谷歌地图、谷歌办公套件、谷歌云认证培训服务。

本文将讨论 GKE 中的 5 个功能,您现在可以使用这些功能来优化您的集群。要开始在 GKE 中测试这些,请查看交互式教程以开始使用标准自动驾驶仪集群。

如果您从组织中的 Kubernetes 集群上运行工作负载中发现价值,那么您的足迹很可能会增加——无论是通过更大的集群还是更多的集群。

无论采用哪种方法,有一件事是肯定的:您将拥有更多需要付费的资源。你知道他们怎么说——更多的资源,更多的问题。跨集群拥有的资源越多,确保有效使用它们就变得越重要。

Google Kubernetes Engine 具有许多内置功能,作为集群管理员,您可以使用这些功能来导航优化 GKE 中资源使用的持续旅程。

1、控制台中的集群视图成本优化

如果您不知道从哪里开始优化您的集群,最好的起点是寻找一个突出的大问题。通过查看跨越所有集群的视图,这可能是最明显的。

在 GKE 中,谷歌在控制台中内置了一个集群级成本优化选项卡,其中包含丰富的信息,否则您自己收集起来可能很麻烦。

您可以找到它,如下图所示:

图 1 - 导航到云控制台中的成本优化选项卡

导航到此选项卡后,您会看到时间序列可视化。

对于 GKE 标准集群,此可视化是一种时间序列表示,显示项目中所有集群的 CPU 和内存的三个关键维度:

·Total CPU/Memory allocatable- 可分配给用户工作负载的 CPU 数量或 GB 内存

·Total CPU/Memory request - 用户工作负载请求的 CPU 或 GB 内存

·Total CPU/Memory usage- 用户工作负载的 CPU 数量或 GB 内存的实际使用情况

图 2 - 指定窗口内所有标准 GKE 集群中 CPU 或内存的可分配、请求和使用时间序列数据

分析这些相互之间的关系有助于确定重要优化问题的答案,例如:

·谷歌的 GKE 标准集群中是否有太多可分配的 CPU 和内存闲置?如果是这样,谷歌是否可以做一些事情,比如重新评估谷歌在节点池中使用的机器类型?通过将更高百分比的可分配资源分配给 Pod 请求,这可以帮助谷歌对集群进行 bin pack。

·在谷歌的 GKE 标准集群中运行的工作负载是否需要过多未使用的 CPU 和内存?如果是这样,谷歌可以做一些事情,比如与工作负载所有者合作来调整请求吗?这可以帮助谷歌调整工作负载大小,方法是将请求设置为更接近地反映预期使用情况。

如果谷歌使用 GKE Autopilot,这个时间序列可视化看起来会略有不同,如下图所示:

图 3 - 所有 GKE Autopilot 集群中跨 CPU 或内存的请求和使用时间序列数据

对于 GKE Autopilot 集群,谷歌只能查看Total CPU/Memory request和Total CPU/Memory usage数据。但实际上这里什么都没有丢失!

在 Autopilot 集群中,您只需根据请求为每个 Pod 付费;Autopilot 自动处理基础设施的配置,根据您将 Pod 请求设置为什么,为谷歌提供可分配的资源。当谷歌交易节点配置的所有权时,谷歌也交易控制权以在该层进行优化。

对于集群管理员而言,此信息可能会激发行动,例如深入研究各个集群或与工作负载团队会面以解决他们为工作负载设置的请求和限制。在谷歌的研究中,这可能是许多团队优化的最具影响力的领域。谷歌将在本博客中深入探讨 GKE 如何启用此练习。

当沿着这些路径前进时,拥有财务数据有助于量化优化对业务的影响。自行收集此信息可能需要一些工作(对于某些人来说,还需要大量电子表格!),但幸运的是 GKE 具有另一个本机功能,可帮助您轻松访问此信息。

2、GKE 成本分配

GKE 成本分配是一项原生 GKE 功能,它将工作负载使用情况与 Cloud Billing 及其报告集成在一起,使您不仅可以在每个集群级别,而且可以在每个 Kubernetes 命名空间或每个 Kubernetes 标签级别查看和提醒计费。

它必须在您的集群上启用才能运行,因此如果您正在使用现有的 GKE 集群并希望启用它,请在设置适当的地区或区域后使用以下 gcloud 命令:

$ gcloud beta container clusters create $CLUSTER_NAME \


--enable-cost-allocation


图 4 - 启用成本分配的 GKE 集群中命名空间的 Cloud Billing 报告

如果没有 GKE 成本分配,集群及其可能运行的所有不同工作负载的财务影响会有些模糊。由于集群是计费中最详细的级别,因此找到要优化的区域甚至执行分摊和计费都是一项挑战。

随着命名空间和标签不断涌入账单报告,您现在可以了解工作负载在 Kubernetes 中定义的 CPU/内存请求的成本。一个警告 - 当您使用命名空间和标签来逻辑定义和组织团队及其工作负载时,这最有效。

这种集成还提供了更广泛的优化图景——因为 GKE 通常不在孤岛上!理论上,团队命名空间中的工作负载可以使用外部支持服务,如 Cloud Memorystore,这也是其使用的关键部分。

由于 Cloud Billing 数据具有所有GCP 服务,谷歌现在可以跨命名空间及其相应的支持服务进行过滤和查询。

3、控制台中的工作负载视图成本优化

一旦您确定了您可能想要与之合作的团队,GKE 会在工作负载级别提供一个成本优化选项卡,然后您可以在其中开始向下钻取并确定可以通过称为“工作负载调整大小”的练习来优化的特定工作负载. 这是确保 Pod 请求更接近地反映其预期用途的行为。

图 5 - GKE 成本优化选项卡下的单个工作负载条形图

正如您在此处看到的,谷歌提供了条形图来表示使用情况、请求和限制之间的关系。

·深绿色:CPU/内存使用率

·浅绿色:CPU/内存请求

·灰色:CPU/内存限制

·黄色:CPU/内存使用率超过请求的场景

您还可以将鼠标悬停在每个单独的工作负载条形图上,以在屏幕上显示该数据的小型报告。类似于集群视图成本优化选项卡,您可以向下过滤到自定义时间窗口;谷歌建议在大于一个小时(即一天、一周、一个月)的窗口中查看此数据,以潜在地发现可能会被混淆的昼夜或每周模式。

在这些图表的前面的屏幕截图中,谷歌可以指出一些可能对您来说很突出的模式:

·如果谷歌在条形图上有太多浅绿色堆叠在深绿色之上,谷歌可能会有过度配置的工作负载。

·如果谷歌有一个黄色的条,谷歌有一个请求没有设置足够高的工作负载,这可能是稳定性/可靠性风险 - 在其节点上消耗额外的资源并且如果达到其限制则可能被限制或 OOMKilled。

·如果谷歌有一个全是深绿色的条,这意味着谷歌没有为工作负载设置请求 - 这不是最佳实践!设置这些请求。

有了这些信息,就可以更轻松地快速识别需要为成本优化或稳定性和可靠性调整请求和限制的工作负载。

4、调整工作负载请求的建议

在谷歌需要增加或减少 CPU/Memory 请求的场景中,知道它需要做比知道它需要如何做更容易。谷歌应该将请求设置为什么?

图 6 - 针对工作负载的 CPU 和内存的 Vertical Pod Autoscaler 建议

GKE 将来自 Kubernetes Vertical Pod Autoscaler (VPA) 的建议直接集成到其工作负载控制台中,目前适用于集群中的所有部署。Actions > Scale > Scale compute resources在查看特定工作负载的页面时, 您可以通过导航到菜单找到它。

重要的是要记住,这些建议只是建议。它们基于历史使用数据,因此在查看这些值时,重要的是要与工作负载所有者合作,看看这些建议是否适合合并到他们各自的 Kubernetes 清单中。

5、成本估算和集群创建设置指南

最后,如果您刚刚开始使用 GKE,并且希望从正确的、优化的角度开始,谷歌已将工具整合到 GKE 集群创建页面中。

图7 - 集群创建设置指南 (1) 和集群创建成本估算 (2)

首先,谷歌有一个设置指南,可以帮助您创建一个固定的 GKE 标准集群,其中已经启用了谷歌在此讨论的一些功能,例如 GKE 成本分配和 Vertical Pod Autoscaler。

其次,谷歌还有一个成本估算面板,它会根据您的 GKE 标准集群的配置向您显示估算的每月成本。如果您希望集群扩大和缩小规模,这甚至可以帮助您获得一系列潜在成本!

怎么办?

跨一组 GKE 集群的优化可能包括一些需要考虑的领域——这不是一次性任务!相反,这是一个持续的旅程,集群管理员、工作负载所有者,甚至计费经理都参与其中。GKE 提供的工具可以让这个旅程和过程变得更轻松,并让正确的数据和见解触手可及。

要熟悉 GKE 中的这些功能,请查看谷歌的交互式教程以开始使用标准自动驾驶集群。

您还可以在以下视频中观看展示其中大部分功能的演示:

https://youtu.be/sYdCqxM7OFM

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12873.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

那个帮爷爷卖茶叶的善良女孩,可能是ChatGPT

詹士 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT,越来越刑了! 已有不法分子将其“打扮成”年轻女孩,放社交软件上,引诱男性上钩,进而实施诈骗。 △ 面向中国市场,可能是个朋友圈里的卖茶女孩 事实上,据For…

Java调用ChatGPT(基于SpringBoot和Vue)实现连续对话、流式输出和自定义baseUrl

目录 版本更新说明1. 配置阶段1.1 依赖引入1.2 配置application.yml文件1.3 注解添加 2. 使用2.1 生成回答2.1.1 测试 2.2 生成图片2.2.1 测试 2.3 下载图片2.3.1 测试 2.4 生成流式回答2.4.1 流式回答输出到IDEA控制台2.4.2 流式回答输出到浏览器页面2.4.3 流式回答结合Vue输出…

copilot平替tabnine解析

1.copilot 借着最近chatgpt大火的东风,copilot又重新火了一把。 什么是copilot?直接上wiki百科上的解释 GitHub Copilot是GitHub和OpenAI合作开发的一个人工智能工具,用户在使用Visual Studio Code、Microsoft Visual Studio、Vim、Cursor或…

ChatGPT 停售 Plus 会员!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 今天凌晨 2 点,一位名为 anton 的网友发推表示,ChatGPT Plus 已无法开通。 给出的理由是,现在 GPT 需求量太大,严重超载,算力有点…

【数学建模】 灰色预测模型

数学建模——预测模型简介 https://www.cnblogs.com/somedayLi/p/9542835.html 灰色预测模型 https://blog.csdn.net/qq_39798423/article/details/89283000?ops_request_misc&request_id&biz_id102&utm_term%E7%81%B0%E8%89%B2%E9%A2%84%E6%B5%8B%E6%A8%…

文言一心,ChatGLM-6B和ChatGPT等模型概述

原文首发于博客文章大语言模型概况 定义 (个人理解的)大语言模型(Large Language Model)是一种基于深度学习技术的自然语言处理通用模型,它可以通过学习大规模文本数据的模式和规律,从而实现对自然语言的理…

Axure页面设置管理灰色,无法设置怎么办?

我昨天在知乎上找到AxurePR9以及对应的安装包,但是安装完后发现【项目】选项卡下面的页面样式管理器是灰色的,无法设置相关的参数。但是我把原来的软件给删掉了,没有截图保存。 后面我找到了一个方法,大家可以参照一下&#xff1…

错过了前三次的伟大革命(蒸汽机革命、电气革命、信息革命),GPT-4 你还要错过人工智能AI革命吗!!!

错过了前三次的伟大革命(蒸汽机革命、电气革命、信息革命),GPT-4 你还要错过人工智能AI革命吗!!! 看 GPT-4 是如何炼成绝世神功:葵花宝典? 欲练神功,不必自宫。西方不败—…

最贵的教育方式有望普及了

我们要学习的知识是一张网,这张网上每个节点都是知识点,知识点之间彼此关联。 在学习这个主题之前,张大胖可能已经掌握了A和D 而何小痩已经掌握了I和J 而一个教程/文章可能只涵盖了这些: 所以张大胖在看文章过程中,遇到…

【GPT-4】免费开源的 MiniGPT-4 —— 提供类似 GPT-4 的图像理解与对话能力,让你先人一步感受到图像对话的强大之处。

GPT-4 是一个大型多模态模型(接受图像和文本输入,提供文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平”,OpenAI 表示。 OpenAI 联合创始人Sam Altman 表示,它是“迄今为止功能最强大、最一致的模型”,能够使用图像和文本。…

2023异想大会|星尘数据CEO章磊:懒惰是第一生产力,ChatGPT给了我们一个懒惰的机会

5月18日,由《财经天下》、「市界」、《博客天下》联合举办的2023年异想大会在北京召开,大会以“想象创未来”为主题,邀请来自各领域的多名企业家、专家,探索下一个能够改变商业世界的“异想”。 在大会“天工开物——人工智能劈开…

对OpenAI重拳出击!美国政府出手「开源」ChatGPT,Altman惊慌连发3推

FTC突然对OpenAI展开调查,Altman连发3推澄清。FTC对阵OpenAI的大戏正缓缓拉开帷幕。 重磅!美国联邦贸易委员会的调查说来就来! 调查对象不是别人,正是风头正旺的OpenAI。 一封长达20页的调查要求书直接给了Sam Altman当头棒喝。…

【NLP】GPT-4 和 ChatGPT 要点

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

关于GPT-3和GPT-4,你需要知道都在这里

友情提示 提示:本文约3500个文字,字数较长,可直接点击序号进入相关目录阅读字数 文章目录 友情提示前言一、什么是 GPT-3、GPT-4 和 ChatGPT?二、对未来的担忧三、什么时候可以用GPT4?四、GPT-4用在什么地方五、GPT-4能…

OpenAI被曝要搞「App Store」,专卖ChatGPT应用,网友:快搭生态,让苹果微软靠边站...

丰色 发自 凹非寺量子位 | 公众号 QbitAI OpenAI被曝还要再搞一个App Store!‍‍‍‍‍‍‍‍ 这次不是插件商店这样的“小打小闹”,而是真正的大模型超市。‍‍‍‍‍ 据The Information消息,OpenAI将与第三方合作,将他们定制的垂…

OpenAI放大招!推出史上最强「模型商店」,打通所有ChatGPT应用

来源:新智元 OpenAI又双叒叕放大招了! 简单来说,Sam Altman打算把市面上的大模型拉一个平台,搞一个LLM版的App Store。 这样一来,AI模型的生态直接就给OpenAI抢完了。 这个平台属于是双向对接——开发者可以将根据自己…

【GPT-4 ChatGPT】第 1 章 :GPT-4 和 ChatGPT 基础知识

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

【ChatGPT】我们的 AI 安全方法 | Our approach to AI safety

【ChatGPT】我们的 AI 安全方法 | Our approach to AI safety 我们的 AI 安全方法 | Our approach to AI safetyBuilding increasingly safe AI systems | 构建越来越安全的人工智能系统Learning from real-world use to improve safeguards | 从实际使用中学习以改进保障措施P…

Web3中文|GPT-4超越GPT-3.5的五大看点

A Beautiful Cinderella Dwelling Eagerly Finally Gains Happiness Inspiring Jealous Kin Love Magically Nurtures Opulent Prince Quietly Rescues Slipper Triumphs Uniting Very Wondrously Xenial Youth Zealously 这是一段描述童话故事《灰姑娘》的内容,它出…

【让你惊呼的“神器”,ChatGPT inside】

让你惊呼的“神器”,ChatGPT inside ChatGPT 的横空出世,已经搅动了整个科技圈。而它给自然语言处理领域带来的革命性变革,也为很多初创公司和开发者打开了新世界的大门。 在过去,自然语言处理技术通常只被各大科技巨头藏私&…