详细对比超融合服务器硬件平滑升级方案:新建集群 VS 滚动升级

作者:深耕行业的金融团队 刘慧敏

在企业 IT 基础架构运维中,经常会遇到以下问题,从而需要对服务器硬件进行更换或升级:

  • 服务器达到维护期限:通常在金融行业中,生产环境的服务器维护期限在 5 年左右,超过这一期限,服务器需进行下架。
  • 服务器维护成本上升:服务器使用时间较长,硬件故障或老化会导致性能和稳定性下降,从而增加了企业在人力、物力等方面的运维成本。
  • 服务器难以满足业务需求:随着业务的发展和需求的变化,早期购置的服务器配置无法满足当前的业务需求,升级服务器硬件便需提上日程。

问题是,在硬件升级的同时,运维人员应如何保障关键业务正常开展、性能和稳定性不受到升级影响?针对这一需求,SmartX 为运维人员提供了“新建集群”和“滚动升级”两种方案,帮助企业平稳实现基于超融合架构的服务器硬件替换与升级。下面我们将对两种方案进行详细对比,并通过 2 例实践案例,为用户提供方案选择和落地参考。

超融合服务器平滑升级方案

方案1:新建集群

01server-hardware-update.png

利用新服务器组建一个新集群,将原集群的虚拟机通过跨集群迁移的方式迁移至新集群,从而完成服务器的平滑升级。

方案2:滚动升级

02server-hardware-update.png

03server-hardware-update.png

通过在原有集群中依次对服务器进行替换的方式,实现服务器平滑升级。滚动升级步骤如下:

  1. 迁移虚拟机:将原服务器节点上的虚拟机迁移至集群中其他服务器节点。
  2. 迁移数据:将原服务器节点上的存储数据迁移至集群中其他服务器节点。
  3. 移除节点:将原服务器节点从集群中移除。
  4. 下架服务器:将原服务器节点关机下架。
  5. 上架新服务器:将新服务器节点加电、连线和上架。
  6. 添加节点:新服务器节点加入至原集群中。
  7. 回迁虚拟机:将虚拟机回迁至新服务器节点上。

欲深入了解服务器硬件滚动升级特性与用户实践,请阅读:如何做到 IT 基础架构软硬件升级简单又不停机?。

平滑升级方案对比

以上提到的两种方案皆可实现服务器硬件平滑升级。而两者分别适合什么样的升级环境?企业应如何选择合适的升级方案?我们可以从以下维度进行对比和评估。


业务连续性

04server-hardware-update.png

在进行服务器硬件平滑升级时,需保障升级期间集群中的虚拟机业务不受影响。

这两种升级方案都涉及了虚拟机迁移操作。在滚动升级方案中,虚拟机迁移仅涉及计算资源迁移;在新建集群的方案中,虚拟机迁移包含了计算资源迁移和存储资源迁移。虽然这两种方案都可做到不影响虚拟机业务,但因新建集群涉及了存储迁移操作,当集群中存在对业务连续性和 I/O 低延迟要求较高的业务时,滚动升级方案会优于新建集群的方式。


服务器数量

05server-hardware-update.png

滚动升级方案对新服务器数量并无限制,而新建集群方案中,需确保新服务器数量不低于 3 台。因此,当计划对集群中低于 3 台服务器进行升级时,仅能选择滚动升级方案。


虚拟机 CPU 兼容性

06server-hardware-update.png

无论是新建集群方案还是滚动升级方案,都需要确保虚拟机可以顺利完成迁移操作。SmartX 集群部署完成后默认会开启虚拟机 CPU 兼容性功能,根据当前宿主机的 CPU 类型和特性,为虚拟机选择一个最接近 的 CPU 模型,同时可以让集群中的虚拟机都继承此 CPU 特性。这一功能可以让虚拟机在不同代数(Generation)的 CPU 中进行平滑迁移。此外,虚拟机也可自定义选择 CPU 兼容性,比如物理透传或者其他 CPU 的兼容性。

因此,为了确保虚拟机可以顺利完成迁移操作,目标主机或者集群的 CPU model 中必须包含待迁移虚拟机的 CPU model 指令集,并且虚拟机迁移到新集群或者目标主机后,此虚拟机依旧继承迁移前的 CPU model。

如果目标主机或者集群不满足平滑迁移条件,则需要将虚拟机进行关机后再进行迁移。


网络资源

07server-hardware-update.png

在网络资源方面,滚动升级方案可复用原有配置,而新建集群方案需进行重新配置。这个维度主要考虑,当前集群是否具备新建集群的条件。新建集群需同时满足以下 3 个条件:

  • 机房机柜预留了可放置新服务器的空间。
  • 交换机预留了管理、存储以及业务网络的端口。
  • 新集群有足够的地址为管理、存储以及业务等 IP 地址进行规划。

如果满足,则可以选择新建集群和滚动升级这 2 种方案;如不满足,则选择滚动升级的方式。


集群调整

08server-hardware-update.png

在进行服务器硬件升级前,用户可能计划对以下方面进行调整,如:

  1. 业务网络调整:计划将集群中的业务网络和管理网络进行物理层面的隔离。
  2. 机房机柜更改:计划将服务器放置到 IDC 进行统一管理。
  3. 虚拟化平台变更:计划将基于 VMware 虚拟化的 SmartX 超融合集群,变更为基于 SmartX 原生虚拟化 ELF 的集群。
  4. CPU 供应商变更:计划将部分业务迁移至信创集群。

如本次集群调整涉及虚拟化平台和 CPU 供应商的变更,因同一个集群中不能同时存在 2 种虚拟化和 2 种 CPU 供应商,所以需要通过新建集群的方式进行服务器硬件升级。如不涉及这两个方面的变更,那么新建集群和滚动升级方式皆可供选择。


适用场景

以上提到的两种服务器平滑升级方案并不存在对立的关系,相反,它们在适用场景上存在较多的重合部分。根据以上分析,我们对这两种升级方案在适用场景上的区别进行了以下总结:

09server-hardware-update.png

用户案例:方案选择与落地实践

案例 一:采用滚动升级方案实现服务器平滑升级

升级背景

  1. 10 节点 SmartX 超融合(基于原生虚拟化 ELF)集群,单节点存储使用容量为 15TB – 20TB。
  2. 1 周内需要完成其中 4 台服务器升级。
  3. 集群存在业务连续性要求较高且要求 I/O 低延迟的业务,升级期间需尽量保障虚拟机业务不受影响。
  4. 机房无多余机柜空间以及交换机端口,IP 地址段无多余 IP 地址可供分配。

方案选择与实践

用户当前环境无多余网络资源,同时由于仅升级集群中的部分硬件服务器,应选择滚动升级的方式。采用此方案,一方面可以使新服务器复用原有的服务器网络配置,无需更改网络资源;另一方面,升级部分硬件服务器无需将 1 个集群拆分为 2 个集群,这样可避免增加客户的集群维护工作量。

最终,用户采用滚动升级的方式,在一周时间内,顺利地完成了硬件服务器平滑升级的操作。


案例二:采用新建集群方案实现服务器平滑升级

升级背景

  1. 8 节点 SmartX 超融合集群,单节点存储使用容量为 12TB – 15TB。
  2. 3 周内需要完成 8 台服务器升级。
  3. 8 节点集群被规划为测试集群,机房和集群网络需要被重新调整。
  4. 在升级期间需尽量保障虚拟机不到影响。

方案选择与实践

用户有集群调整的需求,应选择新建集群的方式来进行服务器平滑升级。在这个方案中,新建集群的网络调整以及位置重新放置等操作,对原有集群几乎不产生任何影响,仅需要将原有集群的虚拟机进行跨集群迁移,即可完成全部虚拟机的迁移动作。

最终用户采用此方案,同样在一周时间内,顺利地将 8 个节点的硬件服务器进行了平滑升级。

此外,五矿期货有限公司也利用 SmartX 超融合对异构集群的支持特性,从 4 节点纯软件(基于 SmartX 原生虚拟化 ELF)逐步扩容到 10 节点,同时完成了从超微四子星到 Dell PowerEdge R730xd 的服务器升级替换。更多案例细节,请阅读:五矿期货超融合硬件平滑升级与多数据中心管理实战。

您还可以扫码获取《SmartX 超融合技术原理与特性解析合集(含 VMware 对比详情)》介绍,了解更多 SmartX 超融合功能特性与使用场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/113716.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

三十七个常见Vue面试题,背就完事了二

八、vue.mixin的使用场景和原理? Vue的mixin的作用就是抽离公共的业务逻辑,原理类似对象的继承,当组件初始化的时候,会调用mergeOptions方法进行合并,采用策略模式针对不同的属性进行合并。 如果混入的数据和本身组件的数据有冲突…

《向量数据库》——为何向量数据库对大模型LLM很重要?

当您浏览Twitter、LinkedIn或新闻源上的时间轴时,可能会看到一些关于聊天机器人、LLM和GPT的内容。因为每周都有新的LLM发布,很多人都在谈论LLM。 我们目前置身于一场人工智能革命,许多新应用都依赖于向量嵌入。不妨让我们更多地了解向量数据库以及为什么它们对LLM很重要。…

图书管理系统Java书店进销存jsp源代码MySQL

本项目为前几天收费帮学妹做的一个项目,Java EE JSP项目,在工作环境中基本使用不到,但是很多学校把这个当作编程入门的项目来做,故分享出本项目供初学者参考。 一、项目描述 图书管理系统 系统有1权限:管理员 用所技…

产能紧张,联电、日月光急单要涨价 | 百能云芯

台积电在CoWoS先进封装领域的产能紧张,这导致英伟达在AI芯片方面的生产受到限制。有消息称,英伟达正考虑通过加价寻找除台积电以外的替代生产能力,以应对这一局面。这一消息引发了巨大的订单涌入效应。 联电公司作为提供CoWoS中间层材料的供应…

Android开发血动脉——Binder机制

Binder是Android中的一个类,它继承了IBinder接口。从IPC角度来说,Binder是Android中的一种跨进程通信方式,Binder还可以理解为一种虚拟的物理设备,它的设备驱动是/dev/binder,该通信方式在linux中没有。从Android Fram…

什么是OLAP

一、什么是OLAP OLAP(On-line Analytical Processing,联机分析处理)是在基于数据仓库多维模型的基础上实现的面向分析的各类操作的集合。可以比较下其与传统的OLTP(On-line Transaction Processing,联机事务处理&…

3D风速仪 Gill Instruments Limited_R3-50 R3-100 and R3A -100 Manual

R3测量超声波脉冲从上部换能器到相反的下部换能器所花费的时间,并将其与脉冲从下部换能器到上部换能器的时间进行比较。 同样,在其他上下换能器之间比较时间。 如图1所示,每对换能器之间沿轴的空气速度可以从每条轴上的飞行次数计算出来。 …

深度学习(前馈神经网络)知识点总结

用于个人知识点回顾,非详细教程 1.梯度下降 前向传播 特征输入—>线性函数—>激活函数—>输出 反向传播 根据损失函数反向传播,计算梯度更新参数 2.激活函数(activate function) 什么是激活函数? 在神经网络前向传播中&#x…

git使用

1、在码云上注册账号 2、git官网下载git客户端 3、右键进入git bash进行配置 4、配置用户名,邮箱(码云上的邮箱) 5、配置ssh免密连接(xxxxxx.com就是码云上注册的邮箱) 使用命令 得到密钥 cat~/.ssh/id_rsa.pub 复制…

【python爬虫】3.爬虫初体验(BeautifulSoup解析)

文章目录 前言BeautifulSoup是什么BeautifulSoup怎么用解析数据提取数据 对象的变化过程总结 前言 上一关,我们学习了HTML基础知识,知道了HTML是一种用来描述网页的语言,又了解了HTML的基本结构。 认识了HTML中的常见标签和常见属性&#x…

11、监测数据采集物联网应用开发步骤(8.2)

监测数据采集物联网应用开发步骤(8.1) 新建TCP/IP Client线程类com.zxy.tcp.ClientThread.py #! python3 # -*- coding: utf-8 -Created on 2017年05月10日 author: zxyong 13738196011 import datetime import socket import threading import timefrom com.zxy.adminlog.Us…

交换机端口安全

文章目录 一、802.1X认证1. 定义和起源2. 认证方式本地认证远程集中认证 3. 端口接入控制方式基于端口认证基于MAC地址认证 二、端口隔离技术1. 隔离组2. 隔离原理3. 应用场景 首先可以看下思维导图,以便更好的理解接下来的内容。 一、802.1X认证 1. 定义和起源 8…

国标GB28181安防视频平台EasyGBS角色设备分配功能优化

视频流媒体安防监控国标GB28181平台EasyGBS视频能力丰富,部署灵活,既能作为业务平台使用,也能作为安防监控视频能力层被业务管理平台调用。国标GB28181视频监控EasyGBS平台可提供流媒体接入、处理、转发等服务,支持内网、公网的安…

OpenCV基础知识(9)— 视频处理(读取并显示摄像头视频、播放视频文件、保存视频文件等)

前言:Hello大家好,我是小哥谈。OpenCV不仅能够处理图像,还能够处理视频。视频是由大量的图像构成的,这些图像是以固定的时间间隔从视频中获取的。这样,就能够使用图像处理的方法对这些图像进行处理,进而达到…

视频云存储/安防监控视频/智能分析网关V3裸土未覆盖/苫盖算法功能详解

随着经济的发展和建筑工地的增多,对于土堆的裸露情况实时监测和管理变得尤为重要。为了解决这一问题,TSINGSEEE青犀AI智能分析网关V3的裸土未苫盖算法就能很好地解决。 AI算法模型可以实时识别路面/建筑工地中的土堆是否裸露,将工地、道路等…

idea2023项目上传到gitee

1、按照gitee插件 File——>Settings plugins——>Marketplace下面搜索gitee,然后按照gitee插件 2、上传项目 VCS_——>Share Project on Gitee 如果第一次没登录的需要先登录,登录完后就可以上传了

CCF HPC China2023 | 盛大开幕,邀您关注澎峰科技

2023年8月24日,以“算力互联智领未来”为主题的第十九届全国高性能计算学术年会(CCF HPC China 2023)在青岛红岛国际会议展览中心拉开帷幕。特邀嘉宾涵盖行业大咖,主持阵容同样是“重量级”——来自国家并行计算机工程技术研究中心…

CSS魔术师Houdini,用浏览器引擎实现高级CSS效果

开门见山,直接上货 🔍 CSS Houdini是什么? “Houdini”一词引用自“Harry Houdini”,他是一位20世纪的著名魔术师,亦被称为史上最伟大的魔术师、逃脱术师及特级表演者。 我们都知道,浏览器在渲染网页显示样…

luckfox pico 使用记录

连接 使用USB转TTL 连接 USB 也要一起插上 在显示控制台窗口上会显示板子的IP地址 USB接上后 会在网络和共享中心发现 以太网2(通过RNDIS 通过USB 将板当网卡用,但使用网络共享,无法ping 通外部网) 可以不关闭防火墙(WIN10 6…

对分库分表进行批量操作

对ShardingJDBC基础了解:https://blog.csdn.net/m0_63297646/article/details/131894472 对批量操作案例:https://blog.csdn.net/m0_63297646/article/details/131843517 分为db0和db1两个库,每个库都有三张订单表,分表键根据年份…