DeepSeek开源周Day5: 3FS存储系统与AI数据处理新标杆

项目地址:

  • GitHub - deepseek-ai/3FS: A high-performance distributed file system designed to address the challenges of AI training and inference workloads.
  • GitHub - deepseek-ai/smallpond: A lightweight data processing framework built on DuckDB and 3FS.

开源日历:2025-02-24起 每日9AM(北京时间)更新,持续五天 (5/5)!

引言

在AI技术迅猛发展的浪潮中,DeepSeek以「开源周」形式连续五天发布五大核心基础设施项目,引发行业震动。最终日压轴登场的 Fire-Flyer File System(3FS) 和 smallpond 数据处理框架,更是将存储与计算性能推向新高度。与此同时,OpenAI仓促推出GPT-4.5却因天价API引发争议。本文将全面解析这场技术盛宴的核心突破。


一、颠覆AI训练的分布式存储系统 - 3FS

核心架构解析

3FS架构图

3FS(Fire-Flyer File System) 是专为AI训练设计的分布式文件系统,其创新架构包含三大核心:

  1. 解耦式存储资源池
    整合上千块NVMe SSD(固态硬盘)与RDMA(远程直接内存访问)网络,形成全局存储资源池。计算节点通过高速网络直接访问数据,突破本地存储限制。
  2. CRAQ强一致性协议
    采用链式复制查询分配技术(Chain Replication with Apportioned Queries),确保跨节点数据访问一致性,同时通过读写分离优化性能。
  3. 无状态元数据服务
    基于FoundationDB事务型KV存储构建元数据层,实现毫秒级文件定位,支持10万级QPS(每秒查询量)。

性能实测数据

测试场景配置详情性能表现
峰值吞吐测试180存储节点×16块14TB SSD,500+计算节点通过200Gbps RDMA访问6.6 TiB/s读吞吐量
GraySort排序测试25存储节点处理110.5TiB数据30分钟完成,3.66TiB/min
LLM推理加速KVCache(键值缓存)存储于3FS替代GPU内存峰值40GiB/s读取速度

四大应用场景突破

  1. 数据预处理流水线
    支持PB级数据集的分层目录管理,加速特征工程处理。
  2. 训练数据实时加载
    允许Dataloader跨节点随机访问,无需预排序或缓存。
  3. 分布式检查点保存
    千卡训练任务可30秒内完成模型状态保存。
  4. 推理KVCache外置
    将Transformer的键值对缓存移至3FS,释放30% GPU显存。

二、轻量级大数据处理利器 - smallpond

技术架构亮点

smallpond性能图

基于 DuckDB列式数据库 与3FS构建的轻量框架,实现三大创新:

  1. 无状态计算范式
    摒弃Hadoop/Spark的常驻服务模式,通过Python脚本直接调度计算资源。
  2. 智能数据分片
    自动将PB级数据集划分为8192个分区,结合3FS实现并行处理。
  3. 混合执行引擎
    本地小数据集使用DuckDB单机模式,大规模任务自动切换分布式计算。

实战代码示例

import smallpond
sp = smallpond.init() # 读取3FS中的Parquet数据集
df = sp.read_parquet("3fs://dataset/images-2024")# 分布式SQL处理
df = sp.partial_sql("""SELECT category, AVG(file_size) AS avg_size FROM {0} WHERE resolution > 1080GROUP BY category
""", df)# 结果写入并转换为Pandas
df.write_parquet("3fs://results/image_stats")
print(df.to_pandas().describe())

性能对比测试

框架110TB排序耗时节点数量硬件成本
Hadoop4.2小时200节点$18,000
Spark2.1小时150节点$15,000
smallpond30分钟75节点$7,200

三、OpenAI GPT-4.5:高情商背后的天价成本

核心升级点

GPT-4.5对话示例

尽管宣称在以下方面取得突破,但定价引发开发者强烈反弹:

  1. 情感理解增强
    通过情绪识别模型(Sentiment-aware RLHF)优化对话共情能力
  2. 推理精度提升
    数学问题准确率从GPT-4的82.3%提升至89.1%
  3. 长上下文优化
    支持128K token上下文记忆,遗忘率降低37%

价格对比表

模型输入价格(美元/百万token)输出价格对比DeepSeek v3
GPT-4o5.015.05-10倍
GPT-4.575.0150.0150-280倍
DeepSeek v30.271.0基准

四、开源周全景回顾

DeepSeek开源周技术矩阵:

发布日期项目名称关键技术点性能提升
Day1FlashMLA动态序列长度优化推理速度提升3.2倍
Day2DeepEP专家并行通信库MoE训练效率提升40%
Day3DeepGEMMFP8混合精度计算矩阵运算功耗降低65%
Day4DualPipe/EPLB双向流水线并行+负载均衡千卡训练稳定性提升90%
Day53FS+smallpond分布式存储+轻量计算框架数据吞吐提升10倍

五、行业影响与未来展望

DeepSeek的开源策略正在重塑AI基础设施生态:

  1. 技术民主化加速
    企业可基于开源组件构建完整训练体系,无需依赖AWS/GCP等云厂商专属方案。
  2. 硬件利用率飞跃
    3FS使单GPU卡日均训练任务从3次提升至8次,显著降低算力成本。
  3. 开源模型新机遇
    开发者社区已涌现基于3FS的类Sora视频生成项目VidSeek。

行业分析师预测,Google、Meta等巨头或将在6个月内推出对标方案,而xAI等初创公司可能直接基于DeepSeek生态进行二次开发。


参考引用

  1. DeepSeek开源最后一天
  2. 最后一天!DeepSeek开源3FS系统
  3. GitHub - deepseek-ai/3FS: A high-performance distributed file system designed to address the challenges of AI training and inference workloads.
  4. GitHub - deepseek-ai/smallpond: A lightweight data processing framework built on DuckDB and 3FS.

专业术语解释

  • Fire - Flyer File System(3FS)
    专为AI训练设计的分布式文件系统,通过解耦式存储资源池整合NVMe SSD与RDMA网络形成全局存储资源池,利用CRAQ强一致性协议确保数据访问一致性并优化性能,借助无状态元数据服务实现毫秒级文件定位和高QPS。类似于为AI训练打造了一个超级仓库,能快速准确地提供数据。
  • NVMe SSD(固态硬盘)
    一种高速存储设备,在3FS中作为存储资源被整合到全局存储资源池,为AI训练提供快速的数据存储和读取能力。如同仓库里快速存取货物的货架。
  • RDMA(远程直接内存访问)
    一种网络技术,用于3FS中计算节点与存储资源池之间的高速数据访问,突破本地存储限制。类似一条高速通道,让数据快速在不同地方传输。
  • CRAQ强一致性协议(Chain Replication with Apportioned Queries)
    采用链式复制查询分配技术,保证3FS跨节点数据访问的一致性,并通过读写分离优化性能。就像一个严格的规则制定者,确保数据在不同节点间的访问都准确无误且高效。
  • 无状态元数据服务
    基于FoundationDB事务型KV存储构建的元数据层,在3FS中实现毫秒级文件定位,支持高QPS。好比一个智能导航系统,能快速找到文件在仓库中的位置。
  • QPS(每秒查询量)
    衡量系统处理能力的指标,3FS的无状态元数据服务可支持10万级QPS,代表其每秒能处理大量的文件查询请求。类似一个服务员每秒能接待多少顾客的询问。
  • GraySort排序测试
    一种用于测试系统数据处理能力的测试场景,在3FS的性能测试中,25个存储节点能在30分钟内处理110.5TiB数据。就像对仓库货物整理能力的一次考验。
  • LLM推理加速
    通过将KVCache存储于3FS替代GPU内存,提高大语言模型(LLM)推理速度,在3FS中能达到峰值40GiB/s的读取速度。如同给推理过程找到了一条捷径。
  • KVCache(键值缓存)
    在LLM推理中,将Transformer的键值对缓存移至3FS可释放30% GPU显存。类似于把一些临时数据存放到外部仓库,腾出空间给更重要的工作。
  • smallpond
    基于DuckDB列式数据库与3FS构建的轻量级大数据处理框架,采用无状态计算范式、智能数据分片和混合执行引擎等创新技术。像一个小巧灵活的工具,能高效处理大数据。
  • DuckDB列式数据库
    smallpond框架的基础之一,提供单机数据处理能力,在smallpond中用于本地小数据集处理或作为大规模任务分布式计算的基础组件。类似一个小型加工厂,处理小规模的数据。
  • 无状态计算范式
    smallpond摒弃Hadoop/Spark的常驻服务模式,通过Python脚本直接调度计算资源。就像不需要长期驻扎的团队,有任务时直接调用资源完成工作。
  • 智能数据分片
    smallpond自动将PB级数据集划分为8192个分区,结合3FS实现并行处理,提高数据处理效率。类似于把一大块工作分成许多小块,同时进行处理。
  • 混合执行引擎
    smallpond本地小数据集使用DuckDB单机模式,大规模任务自动切换分布式计算。如同一个智能的工人,遇到小任务自己做,大任务就叫上其他人一起做。
  • Sentiment - aware RLHF(情绪识别模型)
    OpenAI用于优化GPT - 4.5对话共情能力的技术,通过该模型增强情感理解。就像给模型安装了一个“情感探测器”,让它更懂人类情感。

DeepSeek开源周不仅展示了中国AI公司的技术实力,更重要的是推动行业进入「开放创新」新阶段。当6.6TiB/s的存储吞吐遇上社区智慧,或许下一次AI革命的火花就诞生于某个开发者的GitHub仓库。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25822.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是多线程?线程池?

文章目录 一、什么是多线程?二、多线程的实现方法1. 继承Thread类,重写run方法2. 实现Runnable接口,并创建Thread对象3. Callable和Future 三、线程的5种状态**New(新创建)****Runnalbe(可运行)****Running****Blocked(阻塞)****等…

MES生产制造执行管理系统(源码+配套文档)

在当今竞争激烈的制造业环境中,企业要想保持竞争优势,就必须不断提升生产效率、优化管理流程。MES(制造执行系统)作为连接上层计划管理与底层工业控制的桥梁,正逐渐成为众多制造企业转型升级的关键工具。一个功能全面的…

AI伦理挑战:如何确保技术发展符合道德规范?

引言 随着人工智能(AI)技术的快速发展,我们正迎来一个前所未有的数字化时代。AI的应用已经渗透到医疗、教育、金融、交通等众多领域,极大地推动了生产效率的提升,改善了人们的生活质量。从智能医疗诊断到自动驾驶汽车…

Qt 自带颜色属性

Qt 系统自带颜色如下: enum GlobalColor {color0,color1,black,white,darkGray,gray,lightGray,red,green,blue,cyan,magenta,yellow,darkRed,darkGreen,darkBlue,darkCyan,darkMagenta,darkYellow,transparent};对应颜色如下: color0: 这是自定义颜色…

MySQL慢查询分析与处理

什么是慢日志 慢日志是MySQL用来记录数据库中执行较慢的SQL语句的日志,当数据库遇到性能问题时,慢日志可以帮助我们分析数据库中执行较慢的SQL。 如何打开数据库慢日志功能 MySQL默认是关闭慢日志功能的,可以从数据库中或者从配置文件中进行…

深度学习基础--ResNet50V2网络的讲解,ResNet50V2的复现(pytorch)以及用复现的ResNet50做鸟类图像分类

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 前言 如果说最经典的神经网络,ResNet肯定是一个,从ResNet发布后,作者又进行修改,命名为ResNe50v2&#xff0c…

TikTok隐私保护措施:确保用户安全

TikTok隐私保护措施:确保用户安全 在这个信息爆炸的时代,社交媒体平台的隐私保护问题日益成为公众关注的焦点。TikTok,作为全球领先的短视频平台,拥有庞大的用户群体,因此,其隐私保护措施显得尤为重要。本…

FFmpeg-chapter3-读取视频流(原理篇)

ffmpeg网站:About FFmpeg 1 库介绍 (1)libavutil是一个包含简化编程函数的库,包括随机数生成器、数据结构、数学例程、核心多媒体实用程序等等。 (2)libavcodec是一个包含音频/视频编解码器的解码器和编…

【Redis】Mac系统一键安装redis

要在 macOS 上一键安装 Redis,可以使用 Homebrew(一个流行的包管理工具)来简化安装过程。下面是可以执行的安装脚本: 安装脚本: #!/bin/bash# 检查 Homebrew 是否已安装,如果没有安装,则安装 …

P1149 [NOIP 2008 提高组] 火柴棒等式c/c++

P1149 [NOIP 2008 提高组] 火柴棒等式c/c 题目描述 给你 n 根火柴棍,你可以拼出多少个形如 ABC 的等式?等式中的 A、B、C 是用火柴棍拼出的整数(若该数非零,则最高位不能是 0)。用火柴棍拼数字 0∼9 的拼法如图所示&a…

七星棋牌 6 端 200 子游戏全开源修复版源码(乐豆 + 防沉迷 + 比赛场 + 控制)

七星棋牌源码 是一款运营级的棋牌产品,覆盖 湖南、湖北、山西、江苏、贵州 等 6 大省区,支持 安卓、iOS 双端,并且 全开源。这个版本是 修复优化后的二开版本,新增了 乐豆系统、比赛场模式、防沉迷机制、AI 智能控制 等功能&#…

安全模块设计:token服务、校验注解(开启token校验、开启签名校验、允许处理API日志)、获取当前用户信息的辅助类

文章目录 引言pom.xmlI 校验注解ApiValidationII token服务TokenService获取当前用户信息的辅助类III 域登录接口响应数据登陆用户信息引言 pom.xml <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/PO…

贪心算法精品题

1.找钱问题 本题的贪心策略在于我们希望就可能的保留作用大的5元 class Solution { public:bool lemonadeChange(vector<int>& bills) {std::map<int ,int> _map;for(auto ch:bills){if(ch 5) _map[ch];else if(ch 10){if(_map[5] 0) return false;else{_m…

辛格迪客户案例 | 鼎康生物电子合约系统(eSign)项目

01 案例企业 鼎康(武汉)生物医药有限公司于2013年06月19日成立 &#xff0c;是一家总部位于湖北武汉的CDMO公司&#xff0c;坚持以客户为中心&#xff0c;以及时、经济和高质量为服务导向。鼎康生物拥有先进的150,000平方英尺的生产厂房&#xff0c;生产设施位于中国武汉的Bio…

多个pdf合并成一个pdf的方法

将多个PDF文件合并优点&#xff1a; 能更容易地对其进行归档和备份.打印时可以选择双面打印&#xff0c;减少纸张的浪费。比如把住宿发票以及滴滴发票、行程单等生成一个pdf&#xff0c;双面打印或者无纸化办公情况下直接发送给财务进行存档。 方法: 利用PDF24 Tools网站 …

算法-数据结构(图)-迪杰斯特拉最短逻辑算法( Dijkstra)

迪杰斯特拉算法&#xff08;Dijkstras Algorithm&#xff09; 是一种用于计算单源最短路径的经典算法&#xff0c;由荷兰计算机科学家 艾兹赫尔迪杰斯特拉&#xff08;Edsger W. Dijkstra&#xff09; 于1956年提出。它的主要目标是找到从图中的某个源节点到所有其他节点的最短…

windows设置暂停更新时长

windows设置暂停更新时长 win11与win10修改注册表操作一致 &#xff0c;系统界面不同 1.打开注册表 2.在以下路径 \HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\WindowsUpdate\UX\Settings 右键新建 DWORD 32位值&#xff0c;名称为FlightSettingsMaxPauseDays 根据需求填写数…

降维攻击!PCA与随机投影优化高维KNN

引言&#xff1a;高维数据的“冰山困境” 假设你正在处理一个电商平台的商品图片分类任务&#xff1a;每张图片被提取为1000维的特征向量&#xff0c;100万条数据的距离计算让KNN模型陷入“维度地狱”——计算耗时长达数小时&#xff0c;且内存占用超过10GB。 破局关键&#…

在ubuntu 24.04.2 通过 Kubeadm 安装 Kubernetes v1.31.6

文章目录 1. 简介2. 准备3. 配置 containerd4. kubeadm 安装集群5. 安装网络 calico 插件 1. 简介 本指南介绍了如何在 Ubuntu 24.04.2 LTS 上安装和配置 Kubernetes 1.31.6 集群&#xff0c;包括容器运行时 containerd 的安装与配置&#xff0c;以及使用 kubeadm 进行集群初始…

信刻光盘安全隔离与信息交换系统让“数据摆渡”安全高效

随着数据传输、存储及信息技术的飞速发展&#xff0c;信息安全保护已成为重中之重。各安全领域对跨网数据交互的需求日益迫切&#xff0c;数据传输的安全可靠性成为不可忽视的关键。为满足业务需求并遵守保密规范&#xff0c;针对于涉及重要秘密信息&#xff0c;需做到安全的物…