高精尖领域数据暴增,分布式存储渐当大任

近年来,数据存储市场“最靓的仔”无疑就是分布式存储。

大模型火了之后,围绕Chat的应用也越来越多,通过AI生成图片、报表、音视频的应用比比皆是。众所周知,要想训练出一个有学习能力的、可理解的、响应迅速的大模型应用,必经之路是给算法模型“投喂”大量的文本、图像、音视频数据。

面对大量新兴应用场景中爆增的数据,既想“存的下”,还要“读得快”,如果不差钱的话,显然购买更多的存储设备、叠加容量是最省心的选择。但这种方法治标不治本,性能线性提升始终受到机头限制,往往最后让企业“不堪重负”的,是高昂的设备成本和运维成本。

正因如此,分布式存储凭借在性能、性价比等方面的持续突破,终于有机会“大展身手”。并迅速在AI、芯片设计、PACS影像、多媒体编辑等高精尖领域渐当大任,摆脱了"只能做第二存储"的困境。

在深信服近期发布的EDS 501高性能版本中,我们既看到了“最靓的仔”——分布式存储绝非花架子,凭借自研的技术破除性能瓶颈,也看到了一个内外兼修的“硬汉”在高精尖领域中“大展拳脚”,表现出卓越的性能和稳定性。

分布式存储堪当大任

为什么分布式存储能在越来越多高精尖领域中脱颖而出、堪当大任?

 

其一、随着云计算技术与理念走向普及,以及数字化转型的深入,基础设施层面加快分布式相关技术的部署已经成为大势所趋。

例如,《金融科技发展规划(2022—2025年)》就明确要求金融机构建设分布式架构的先进基础设施,加速核心业务应用向分布式基础设施的迁移与部署。

此外,像运营商、制造业、政务等行业都在进行核心业务系统的分布式架构改造与迁移,这无疑让分布式存储今后有机会支撑起更多核心业务系统。

其二、需要主存储支撑的关键业务场景,近年来也在发生显著变化。

《分布式存储发展白皮书》认为,分布式存储当前适用的九大典型应用场景包括HPC、大数据分析、AI、医疗影像等,这些场景里存在着大量以音视频、图片、文档等非结构化数据为主的海量小文件,要想充分挖掘数据中蕴含的巨大价值,亟需一个高性能存储系统来支撑。

其三、分布式存储的崛起最为关键的原因,还是技术上的持续突破。

过去,开源Ceph软件对于分布式存储的普及和推广功不可没;但落后的技术栈、羸弱的性能表现,使得Ceph很难在诸多核心业务场景中取得突破。

如今,像深信服等厂商自研分布式存储系统,技术栈更加先进,加上软硬件结合与适配,在性能、可靠性等方面出类拔萃,胜任高精尖领域的各种存储需求。

高性能分布式存储:离不开技术创新

做分布式存储容易,但做好高性能的分布式存储很难。

这就是为什么分布式存储市场虽然近年来一直保持着高速增长,但市场上的产品、解决方案鱼龙混杂,不少产品性能、可靠性等方面难以令人满意。

可以说,随着闪存介质成本的不断下降,以及像NVMe、PCI-E等协议的快速发展,分布式存储将加速迎来系统架构、软件堆栈和关键技术的一次全面变革:海量多样性数据应用,推动分布式存储面向混合工作负载、多协议互通、解耦式的架构演进、HPC/HPDA、AI等应用对于分布式存储超高性能提出更高要求……

以深信服分布式存储EDS 501高性能版本为例,其正是分布式存储走向全面变革大趋势的一款代表性产品。它在整体架构、技术堆栈以及核心技术的突破,成为了高精尖领域中的一把性能利器,让企业在数字化转型中全速前进。

首先是在架构层面,不同于开源Ceph的系统架构,深信服EDS 501高性能版本采用了清晰分层、解耦协同的架构,Persistence层具备稳定可靠、空间高效、扩展性强等特点;Index层则实现灵活高效的逻辑映射,打造极致低时延;Service层则具备弹性可伸缩、海量的元数据能力;Access层则具备开放兼容、轻量级的协议架构。

 

架构的领先性,使得深信服EDS 501高性能版本承载用户的核心数据生产业务,在激活海量小文件等非结构化数据产能的同时,做到“性能”和“容量”兼得。

其次,深信服EDS 501高性能版本自主研发的凤凰分布式高性能文件系统,在软件堆栈层面更具先进性。支持混合IO负载、兼具大小文件能力,对元数据高并发、小文件密集型、大文件高吞吐和混合负载四种场景有着极好的支撑;同时,凤凰分布式高性能文件系统实现软件解锁单机瓶颈,兼具卓越性能与弹性扩展。

第三,深信服EDS 501高性能版本在分布式存储的核心技术上取得突破,巨量元数据能力、全局IO动态整合、自适应三级缓存和协议增强支持等四大自研创新技术,让分布式存储的性能表现彻底脱胎换骨。

例如,巨量元数据能力在百亿规模文件场景下也能做到存储性能稳定一致,内存缓存元数据的规模提升7倍,在最大化利用系统资源的同时,充分发挥各节点的计算性能;全局IO动态整合技术则释放机械盘顺序写的性能优势,业务写IO可在NVMe SSD组成的大性能层进行智能排序整理后写入容量层,解决小文件写放大导致的空间浪费问题,提升混合配置下的数据回刷速度;自适应三级缓存技术则通过客户端内存—存储节点内存—NVMe SSD缩短数据路径,将数据时延降至us级;协议增强支持则采用更精密的协议设计,进一步降低协议对性能的额外开销,缩短时延和提升性能。

《分布式存储发展白皮书》认为,分布式存储市场正在高速发展,未来具备软硬件一体化能力的厂商和产品会在市场更具优势。深信服EDS利用性能SSD 与容量 HDD 的独立扩展,适应复杂的场景配置,最大限度地发挥裸金属服务器性能的同时,通过软件中立来解锁厂商绑定,不仅减少硬件成本(如避免 SSD 的不合理溢价),还能降低运维保护费用,从整体上降低了总拥有成本。

因此,软硬一体化得以实现端到端的优化,让分布式存储的性能、扩展性和可靠性发挥到极致。

无疑,深信服EDS 501高性能版本已经为市场树立了一个绝佳的标杆。

深入场景,高性能要经受真考验

不可否认,闪存介质成本的持续下降,让分布式存储的性能提升变得不再是一件高门槛的事情,但要做到真正的高性能表现,分布式存储还需要在真实场景中经受考验。

事实上,近年来市场中已经有很多分布式存储产品,在一些性能测试的表现是一顿操作猛如虎,但到真实场景中却是“仔细一看原地杵”。

究其原因,一方面是测试机构的测试方法与实际业务场景相差甚远,尤其是考虑到当下新应用、新场景涌现的情况下,一些测试方法并不能真实反应出分布式存储的性能;另一方面,闪存对于性能的提升,使得一些分布式存储产品满足于“虚荣”的高性能,距离真实场景的高性能存储需求尚有差距。

显然,作为分布式存储领域耕耘多年的厂商,深信服深知分布式存储必须与真实场景的性能需求紧密结合。

例如在医学影像领域,PACS系统等应用对接的各种影像设备都在朝着超高速、高精度方向发展。最典型的就是CT成像技术,320排探测器、动态640层带来了比以往大得多的数据量。此外,PACS系统对接多台医疗设备经常是多台设备同时连续写入,而医生在阅片时又是序列读取,这就使得PACS系统逐渐呈现出连续写、序列读的性能特征。

对此,深信服EDS 501高性能版本在千兆PACS环境阅片测试场景下,能实现秒级加载450幅影像。在上海市肺科医院的PACS影像阅片真实场景,阅片端12秒即可完全加载患者700~800张CT影像,小文件性能表现极为出色。

 

又如,AI、芯片制造、工业设计等领域融合了HPC、大数据和AI技术的应用层出不穷,对于分布式存储的性能要求更为苛刻。在这种“数据密集型”应用承载中,深信服EDS 501高性能版本稳定承载深南电路超过20亿的AI检测文件,实现了EDA前后仿真效率提升40%,性能表现持续刷新预期。

此外,在自然资源&实景三维、多媒体编辑&娱乐等场景中,深信服EDS 501高性能版本也是经受住了各种性能挑战。

截至目前,深信服EDS在AI、医疗医院&生物科技、多媒体编辑&娱乐、自然资源&实景三维、芯片&工业设计等领域累计服务了2万个用户、 完成了35000 小时的稳定交付,承载的PB级项目超过200个。

综合观察,在市场和需求告诉增长的大趋势下,分布式存储迎来了其黄金时代。与此同时,分布式存储的一场技术、产品变革也在发生,架构、技术堆栈以及软硬协同将重塑分布式存储的产品。深信服EDS 501高性能版本在性能等方面的出色表现,无疑为整个市场树立了标杆。面向未来,随着千行百业数字化转型的深入,分布式存储数字底座基石的作用将会愈发突出,也必然会在更多业务场景中发挥关键作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8204.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

极限发问,挑战文心一言底线

目录 毁灭人类种族歧视男女平等未成年人保护人性对与错欺骗梅西进球数总结 昨天终于收到了文心一言的短信,可以进行测试了。正好这几天关于AI安全的问题吵得不可开交,我们可以对文心一言关于偏见,歧视,虚假、错误等问题进行一下测…

langchain 学习笔记

源码地址:https://github.com/kingglory/langchain-chinese-learning/tree/main 基础功能 LLM 调用 支持多种模型接口,比如 OpenAI、Hugging Face、AzureOpenAI …Fake LLM,用于测试缓存的支持,比如 in-mem(内存&am…

面试官:一台服务器最大能支持多少条 TCP 连接?问倒一大片。。。

点关注公众号,回复“1024”获取2TB学习资源! 之前有一位读者向民工哥诉苦,有次面试,好不容易(今年行情大家都懂的)熬到到技术终面,谁知道面试官突然放个大招问他:一台服务器最大能支…

tkinter实现chatGPT对话深色界面

chatGPT官网经常会因为系统升级等情况而不能用, 有时候响应也特别慢, 于是API排上用场. 之前写了一个简易的命令窗式的问答, 能多轮对话, 还能保存对话, 但是输入很不方便. 回头一看额度才用了4毛钱, 于是在api免费期限还剩一个一个月的时候写了一个对话界面, 目前只是单轮对…

chatgpt赋能python:Python主界面设计指南

Python主界面设计指南 Python主界面的设计对于初学者和专业开发人员来说都是至关重要的。在正式开始你的Python编程之前,一个友好、简单、易于理解的界面设计可以使学习曲线变得更加平缓。在这篇文章中,我们将探讨一些Python主界面的设计指南和最佳实践…

SpringBoot 整合 ChatGPT API 项目实战

体验到了ChatGPT的强大之后,那么我们会想,如果我们想基于ChatGPT开发一个自己的聊天机器人,这个能搞定吗? ChatGPT平台已经为技术提供了一个入口了,很简单的就是实现了。 一、准备工作 (1)已成功…

SpringBoot 整合ChatGPT API项目实战

准备工作 (1)已成功注册 OpenAI 的账号。 (2)创建 API KEY,这个 API KEY 是用于 HTTP 请求身份验证的,可以创建多个。 注意这个创建之后需要马上复制好保存,关闭弹框之后就看不到了。 &#xf…

ChatGPT官方鉴别器紧急发布!当代自相矛盾,不想却遭遇群嘲

ChatGPT到处“造假”作弊,现在搞得OpenAI官方都坐不住了。 就在今天,OpenAI紧急发布官方打假工具:基于GPT打造,打开网页就能用。 好家伙,这岂不是真以己之矛攻己之盾了? 一经上线,那叫一个火…

别被chatGPT戏弄了

官方的介绍是,这一模型可以与人类进行谈话般的交互,可以回答追问,连续性的问题,承认其回答中的错误,指出人类提问时的不正确前提,拒绝回答不适当的问题。 科学愉快地玩耍了一下 不设限的问答(加完前置条件后…

如何使用charles代理转发请求

1.安装charles,打开菜单Proxy 打开 Proxy Setting 这个配置,勾选 Enable transparent HTTP proxying 如下图所示,手机端直接代理设置成你的电脑ip(cmd里ipconfig可以看),端口用默认代理端口8888即可 2. 开…

.NetCore HttpClient Proxy 设置全局代理

.NetCore HttpClient Proxy 设置全局代理 环境 .net6.0,使用的是 HttpClient 在Program.cs里面 service.AddHttpClient<HttpClientHelper>();重点是在 HttpClientHelpe 的构造函数里面设置 构造函数会接受来自Program.cs里面注入的 HttpClient 因此我可以直接对其进行配置…

HttpClient5如何设置代理

文章目录 说明原始HttpClient代理HttpClient总结 说明 在这篇文章中会对HttpClient5如何进行代理进行说明&#xff0c;我的HttpClient版本是5.2.1。在进行代理之前请先准备好代理服务器。 原始HttpClient 下面是没有进行代理设置的代码&#xff0c;尝试去访问openai接口 Tes…

开启postman的代理

开启代理&#xff0c;拦截postman的请求&#xff0c;得到具体请求参数 设置中的settings>proxy>添加代理地址与端口

window 流量全局代理

准备工作 proxifierv2rayN(连接远程代理) / fiddler (本地数据捕获) 声明 此文章用于全局流量捕获&#xff0c;技术无罪&#xff0c;请合理合法的使用。 用途 早些时候写过抓取钉钉网课视频连接&#xff0c;钉钉可以设置代理服务器&#xff0c;但是有一些软件不可以设置代…

使用本地网络搭建代理,绕过公司网络屏蔽

公司屏蔽了网易云&#xff0c;斗鱼等 &#xff0c;想用代理绕过屏蔽&#xff0c;达到在公司也可以听歌看视频的目的。 因为穷&#xff0c;没有服务器&#xff0c;就想用家里的电脑的网络转发流量。 按着以上思路前提来想办法。 一、打通网络 让公司的网络能访问到家里电脑的…

什么是 tproxy 透明代理?

在 Istio 最新的 Ambient 模式中&#xff0c;使用了 tproxy 做透明流量劫持&#xff08;见此博客 [1] &#xff09;&#xff0c;这与 Sidecar 模式中基于 IPtables 的流量劫持方式有些许不同&#xff0c;这篇文文章&#xff0c;我们就就一起来探究下什么是 tproxy。 什么是代理…

ChatGPT常用的指令(prompts)系列十——房地产经纪人、物流人员、牙医、网站设计

系列文章目录 内容翻译自&#xff1a;https://github.com/f/awesome-chatgpt-prompts&#xff0c;并加入自己的实践内容 1、 ChatGPT常用的提示语&#xff08;prompts&#xff09;系列一 2、 ChatGPT常用的提示语&#xff08;prompts&#xff09;系列二 3、 ChatGPT常用的提示语…

如果用ChatGpt给OpenTiny官网设计页面会怎样?

听说华为云最近新开源了一个组件库项目,叫OpenTiny。作为一个编程爱好者和对组件库有使用需求的程序猿来讲,必须要看看这个OpenTiny到底有什么不一样,让我立马打开了OpenTiny官网一看究竟。 首先大概了解到OpenTiny 是一套华为云出品的企业级组件库解决方案,适配 PC 端/移…

为什么Facebook账号被封?如何应对Facebook账号被封?

做社媒营销尤其是Facebook&#xff0c;手里有多个账号是家常便饭。运营多个账号您就很可能遇到这一问题&#xff1a;Facebook账号被封。 那么Facebook账号被封该怎么办&#xff1f;本文就聊一聊Facebook账号被封背后的那些事以及如何保护您的Facebook账号。 为什么你的Faceboo…

ChatGPT大封号,注册功能关闭!亚洲成重灾区,网友自救喊话:不要登录,不要登录!...

来源&#xff1a;量子位 | 公众号 QbitAI “不要登录ChatGPT&#xff01;” “暂时远离人工智能和ChatGPT概念板块高位股&#xff01;” 就在这两天&#xff0c;一些关于ChatGPT的疾呼突然在各种社交平台和群聊刷屏了。 而看到这些消息的用户更是感到前所未有的惶恐。 因为导致…