DeepSeek-进阶版部署(Linux+GPU)

前面几个小节讲解的Win和Linux部署DeepSeek的比较简单的方法,而且采用的模型也是最小的,作为测试体验使用是没问题的。如果要在生产环境使用还是需要用到GPU来实现,下面我将以有一台带上GPU显卡的Linux机器来部署DeepSeek。这里还只是先体验单机单卡,后期会更新多机多卡使用更高模型的文章。

1.确认配置

由于是虚拟机,并且虚拟机方面做了配置,所以这里并未显示真实显卡型号,实际型号:NVIDIA Tesla T4 16G。  

[root@deepseek01 ~]# lspci |grep -i nvid00:0d.0 3D controller: NVIDIA Corporation Device 1eb8 (rev a1)[root@deepseek01 ~]# 

2.下载驱动

根据自己的显卡型号下载对应的型号,我这里是NVIDIA Tesla T4 16G。

https://www.nvidia.cn/drivers/lookup/

图片

然后进入搜索下载页面,就可以看到下面的下载地址,这里下载是下载到本地电脑,如果是想直接下载到服务器里面,需要添加一个referer。

图片

     #直接下载会提示403,所以这里添加了一个referer wget --referer=https://www.nvidia.cn/drivers/details/240206/ \ https://cn.download.nvidia.com/tesla/570.86.15/NVIDIA-Linux-x86_64-570.86.15.run

    3.升级内核

    这里需要内核高于4.15才可以,否则驱动会安装失败,所以建议选择更高内核系统,我这里使用是CentOS7.5,做了先升级内核,然后手工编译了gcc才最终安装成功驱动。我在其他环境安装Ubuntu 22.4 则没有这个动作,直接安装下面的包即可(gcc需要换成gcc-12)。

    4.安装工具包

    yum -y install gcc gcc-c++ tar make bzip2 pkgconfig libglvnd-devel libglvnd elfutils-libelf-devel

    5.安装GPU显卡驱动​​​​​​​

    ./NVIDIA-Linux-x86_64-570.86.15.run -a -s -Z \--no-opengl-files
    • -a 或 --accept-license:这个参数表示你接受NVIDIA软件许可协议。如果不使用这个参数,安装过程中会提示你阅读并接受许可协议。

    • -s 或 --silent:这个参数使安装脚本以静默模式运行,不会显示任何用户交互提示,直接进行安装。

    • -Z 或 --disable-nouveau:这个参数用于禁用开源的Nouveau驱动,这是因为NVIDIA官方驱动与Nouveau驱动不兼容。在安装NVIDIA官方驱动之前,通常需要先禁用Nouveau驱动。Ubuntu 22.4需要手工禁用。

    • --no-opengl-files:这个参数告诉安装脚本不要安装OpenGL相关的文件。如果你不需要OpenGL支持(例如,你只打算使用GPU进行计算任务而不是图形渲染),可以使用这个参数。这可能会减少驱动程序包的大小,并避免在某些情况下可能出现的兼容性问题。

    6.检查驱动安装情况

    如下图已经识别到我的显卡。

    图片

    7.GPU驱动常驻内存​​​​​​​

    cd /usr/share/doc/NVIDIA_GLX-1.0/samples/tar xvf nvidia-persistenced-init.tar.bz2cd nvidia-persistenced-init/./install.sh#检查状态是否正常systemctl status nvidia-persistenced.service

    8.下载CUDA

    这里连CentOS7适合的CUDA都没有,这里先用8代替。

    https://developer.nvidia.com/cuda-downloads

    图片

    9.安装CUDA

    接受协议,取消默认驱动,最后是安装

     ./cuda_12.8.0_570.86.10_linux.run --no-opengl-libs

    图片

    图片

    图片

    10.配置环境变量&检查CUDA安装情况​​​​​​​

    添加到/etc/profile文件中,对所有用户生效# vim /etc/profileexport PATH=/usr/local/cuda/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH# source /etc/profile#测试cuda安装是否正确,环境变量是否识别成功# nvcc -V

    图片

    11.安装DeepSeek

    参考上小节:快速搭建DeepSeek-Linux版本,只是这里我选择的8b版本,这里已经显示使用的是我们的GPU。

    图片

    12.验证GPU

    从下图已经可以看出来他正在使用GPU进行运算。

    nvidia-smi

    图片

    总结:操作系统尽量选择比较新的内核,CentOS7,还是老了。

    本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32638.html

    如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

    相关文章

    MySQL的安装与建表

    目录 一,MySQL 安装部署 1.1 版本及下载 1.2安装过程 二,数据库的建立 1,employees 表的建立 2,orders表的建立​ 3,involces表的建立 一,MySQL 安装部署 1.1 版本及下载 MySQL官网地址&#xff1a…

    Spring 框架学习

    技术体系结构 总体技术体系 单一架构 一个项目,一个工程,导出为一个 war 包,在一个 Tomcat 上运行,也叫 all in one。 单一架构,项目主要应用技术框架为:Spring、SpringMVC 、Mybatis。 分布式架构 一个…

    G-Star 公益行起航,挥动开源技术点亮公益!

    公益组织,一直是社会温暖的传递者,但在数字化浪潮中,也面临着诸多比大众想象中复杂的挑战:项目管理如何更高效?志愿者管理又该如何创新?宣传推广怎么才能更有影响力?内部管理和技术支持又该如何…

    STM32-Unix时间戳

    一:什么是时间戳 Unix时间戳(Unix Timestamp)是一个计数器数值,这个数值表示的是一个从1970年1月1日0时0分0秒开始到现在所经过的秒数,不考虑闰秒。 时间戳存储在一个秒计数器里,秒计数器为32位/64位的整…

    zsh: command not found: adb 报错问题解决

    哈喽小伙伴们大家好,我是小李,今天,我满怀信心想要在本地跑一下pda,然而, what? 居然报错了!!别逗我啊! 好吧,究其原因:没有配置好sdk 那就配呗。 首先,…

    嵌入式八股C语言---面向对象篇

    面向对象与面向过程 面向过程 就是把整个业务逻辑分成多个步骤,每步或每一个功能都可以使用一个函数来实现面向对象 对象是类的实例化,此时一个类就内部有属性和相应的方法 封装 在C语言里实现封装就是实现一个结构体,里面包括的成员变量和函数指针,然后在构造函数中,为结构体…

    Linux_17进程控制

    前提回顾: 页表可以将无序的物理地址映射为有序的; 通过进程地址空间,避免将内存直接暴漏给操作系统; cr3寄存器存放的有当前运行进程的页表的物理地址; 一、查看命令行参数和环境变量的地址 因为命令行参数和环境变量都是字符…

    NVIDIA k8s-device-plugin源码分析与安装部署

    在《kubernetes Device Plugin原理与源码分析》一文中,我们从源码层面了解了kubelet侧关于device plugin逻辑的实现逻辑,本文以nvidia管理GPU的开源github项目k8s-device-plugin为例,来看看设备插件侧的实现示例。 一、Kubernetes Device Pl…

    MySql索引下推(ICP)是什么?有什么用?

    目录 基本介绍为什么需要索引下推?未引入ICP(x)引入ICP(√) 如何指导sql优化适用场景sql优化 基本介绍 索引下推(Index Condition Pushdown, ICP),是MySQL5.6 引入的优化技术&#…

    用户可免费体验!国家超算互联网平台上线阿里开源推理模型接口服

    近日,国家超算互联网平台上线阿里巴巴开源推理模型QwQ-32B API接口服务,现在用户可获得免费的100万Tokens。基于国产深算智能加速卡以及全国一体化算力网,平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国产开源大模型的接口服务。 了解QwQ…

    大数据学习(63)- Zookeeper详解

    &&大数据学习&& 🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一下博主哦🤞 &#x1f…

    【蓝桥杯python研究生组备赛】003 贪心

    题目1 股票买卖 给定一个长度为 N 的数组,数组中的第 i 个数字表示一个给定股票在第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易(多次买卖一支股票)。 注意:你不能同时参与多笔交易&…

    mmdet3d.models.utils的clip_sigmoid理解

    Sigmoid 函数 标准的 sigmoid 函数定义为: 容易得出结论: 取值范围(0, 1) clip_sigmoid 是在标准的 sigmoid 函数基础上进行 裁剪(clip),即对 sigmoid 输出的结果加以限制,避免其超出特定范围。 import …

    侯捷 C++ 课程学习笔记:进阶语法之lambda表达式(二)

    侯捷 C 课程学习笔记:进阶语法之lambda表达式(二) 一、捕获范围界定 1. 局部变量与函数参数 ​非静态局部变量:Lambda 所在作用域内定义的局部变量(如函数内部的 int x)会被完整复制其当前值。捕获后外部变…

    有必要使用 Oracle 向量数据库吗?

    向量数据库最主要的特点是让传统的只能基于具体值/关键字的数据检索,进化到了可以直接基于语义的数据检索。这在AI时代至关重要! 回到标题问题:是否有必要使用 Oracle 向量数据库? 这实际还要取决于你的具体应用需求。 客观来讲…

    论文解读 | AAAI'25 CoRA:基于大型语言模型权重的协作信息感知用于推荐

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 点击 阅读原文 观看作者讲解回放! 个人信息 作者:刘禹廷,东北大学博士生 内容简介 将协作信息融入大型语言模型(LLMs)是一种有前景的适应推荐任务的技…

    es扩容节点以后写入数据量增加1倍

    背景: es扩容一倍的数据节点以后 写入数据量增加1倍 业务反馈业务访问量没增加。 最后定位是监控数据: PUT _cluster/settings {"persistent": {"xpack.monitoring.collection.enabled" : "false"} }这个索引记录的是 节…

    G-Star 公益行 | 温暖相约 3.30 上海「开源×AI 赋能公益」Meetup

    你是否曾想过,在这个数字化浪潮席卷的时代,公益组织如何突破技术瓶颈?当 AI 成为热门话题,它能为公益事业带来怎样的温度?开源的力量,如何让每一份善意都拥有无限可能? G-Star 公益行&#xff…

    MySQL数据库复杂的增删改查操作

    在前面的文章中,我们主要学习了数据库的基础知识以及基本的增删改查的操作。接下去将以一个比较实际的公司数据库为例子,进行讲解一些较为复杂且现时需求的例子。 基础知识: 一文清晰梳理Mysql 数据库基础知识_字段变动如何梳理清楚-CSDN博…