DeepSeek 概述与本地化部署【详细流程】

 

目录

一、引言

1.1 背景介绍

1.2 本地化部署的优势

二、deepseek概述

2.1 功能特点

2.2 核心优势

三、本地部署流程

3.1 版本选择

3.2 部署过程

3.2.1 下载Ollama

3.2.2 安装Ollama 

3.2.3 选择 r1 模型

3.2.4 选择版本 

3.2.5 本地运行deepseek模型 

3.3.6 查看已有模型

3.3 使用客户端工具

4. 总结 


一、引言

1.1 背景介绍

DeepSeek,中文名为“深度求索”,是一家位于杭州的人工智能公司,由知名对冲基金 High-Flyer 投资支持。该公司专注于人工智能基础技术研究,并以其开源的大型语言模型在业内脱颖而出。通过将这些模型开源,深度求索不仅推动了技术的发展,还让更多开发者能够参与到人工智能的进步中来,这种开放的态度赢得了广泛的关注和认可。

1.2 本地化部署的优势

通过本地部署,可以完全掌控数据的存储和传输过程,减少了因第三方平台安全漏洞导致的数据泄露风险。避免了将敏感信息上传到云端的风险。这对于涉及个人隐私或商业机密的数据尤为重要。

二、deepseek概述

DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的AI大模型,具备强大的智能问答和多模态交互能力。它能够理解并生成自然语言,提供精准的回答和建议,适用于多个领域,如教育、科技、生活等。DeepSeek的核心优势在于其低成本、高效率的训练和推理能力,打破了传统N卡垄断,降低了大模型的使用门槛。

2.1 功能特点

(1) 深层次逻辑推理

DeepSeek 不仅能够处理简单的问题,还能在面对复杂问题时进行深入的逻辑分析。无论是多步骤的推理还是复杂的决策支持,DeepSeek 都能提供有力的帮助,帮助用户找到最佳解决方案。

(2) 文档解析与总结

无论您需要处理的是 PDF、Word 文档,还是其他格式的文件,DeepSeek 都能轻松应对。只需将文件上传给 DeepSeek,它就能快速分析内容,提取关键要点,并生成简洁明了的总结报告。这一功能特别适合需要高效处理大量文档的专业人士,如研究人员、律师或记者,显著提升工作效率。

(3) 实时信息获取

通过其强大的联网搜索功能,DeepSeek 能够实时抓取最新的信息和数据。这对于那些需要时刻了解最新动态的用户来说尤为重要,比如新闻工作者、市场分析师或任何需要及时获取最新资讯的人士。您可以依赖 DeepSeek 获取最前沿的信息,保持竞争力。当然这一点得结合实际,可能最新消息更新得时间点有所延后。

(4) 全方位应用场景

无论是对话聊天、语言翻译、创意写作、编程辅助、解题答疑、文献解读,还是旅行规划,DeepSeek 都能派上用场。简直是居家旅行必备良品!

2.2 核心优势

(1) 智能化

DeepSeek能够理解复杂的问题,并提供精准的解决方案。它通过深度学习自然语言处理技术,能够理解用户的需求并提供个性化的建议。

(2) 多功能性

DeepSeek在多个领域都有广泛的应用,包括学习、工作和生活。它可以用作学习助手、编程助手、写作助手、生活助手和翻译助手等,满足用户在不同场景下的需求。

(3) 易用性

DeepSeek通过自然语言交互,用户无需学习复杂的操作即可与模型进行对话。这种交互方式使得用户能够轻松地获取所需的信息和服务。

(4) 低成本

DeepSeek的训练和推理成本较低,打破了传统N卡垄断,降低了大模型的使用门槛。这使得更多的企业和个人能够使用高性能的AI服务。

(5) 高效率

DeepSeek在推理能力和响应速度上表现出色,能够快速处理复杂的查询和任务,提供准确的答案和解决方案。

(6) 开源生态

DeepSeek采用了开源策略,吸引了大量开发者和研究人员的参与,推动了AI技术的发展和应用。

(7) 本地部署优势

DeepSeek支持本地部署,确保数据隐私和安全,同时提供更高的性能和稳定性,适合对数据安全要求较高的企业和机构。

三、本地部署流程

3.1 版本选择

本地部署就是自己部署DeepSeek-R1模型,使用本地的算力,

主要瓶颈:内存+显存的大小。

特点:此方案不用联网。

适合:有数据隐私方面担忧的或者保密单位根本就不能上网的。

使用满血版:DeepSeek R1 671B 全量模型的文件体积高达 720GB,对于绝大部分人而言,本地资源有限,很难达到这个配置

蒸馏版本:

蒸馏版本链接:https://huggingface.co/deepseek-ai

开源2+6个模型。R1预览版和正式版的参数高达660B,非一般公司能用。为进一步平权, 于是他们就蒸馏出了6个小模型,并开源给社区。最小的为1.5B参数,10G显存可跑。

如果你要在个人电脑上部署,一般选择其他架构的蒸馏模型,本质是微调后的Llama或Qwen模型,基本32B以下,并不能完全发挥出DeepSeek R1的实力。

3.2 部署过程

3.2.1 下载Ollama

Ollama 是一个开源的大型语言模型(LLM)平台,旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。 Ollama 提供了一个简单的方式来加载和使用各种预训练的语言模型,支持文本生成、翻译、代码编写、问答等多种自然语言处理任务。 Ollama 的特点在于它不仅仅提供了现成的模型和工具集,还提供了方便的界面和 API,使得从文本生成、对话系统到语义分析等任务都能快速实现。

访问链接: Ollama

 根据自己的操作系统选择 ↓ ↓ ↓

3.2.2 安装Ollama 

就傻瓜式安装

安装完成后,检验是否安装成功。

`win+r` 输入 cmd  

命令行输入

ollama -v

能显示版本,就说明安装成功。

3.2.3 选择 r1 模型

 

3.2.4 选择版本 

b代表10亿参数量,7b就是70亿参数量。这里的671B是 HuggingFace经过4-bit 标准量化的,所以大小是404GB

ollama 支持 CPU 与 GPU 混合推理。将内存与显存之和大致视为 系统的 “总内存空间”。 如果你想运行404GB的671B,建议你的内存+显存能达到500GB以 上

除了模型参数占用的内存+显存空间(比如671B的404GB)以 外,实际运行时还需额外预留一些内存(显存)空间用于上 下文缓存。预留的空间越大,支持的上下文窗口也越大。所 以根据你个人电脑的配置,评估你选择部署哪一个版本。如 果你想运行404GB的671B,建议你的内存+显存能达到500GB 以上

这里我们以7B为例,大多数的电脑都能够运行起来。

3.2.5 本地运行deepseek模型 

再命令中,输入如下命令

ollama run deepseek-r1:7b

 

注意:

下载支持断点续传,如果下载中速度变慢,可以鼠标点击命 令行窗口,然后ctrl+c取消,取消后按方向键“上”,可以找到 上一条命令,即”ollama run deepseek-r1:7b“,按下回车会重新链接,按照之前进度接着下载。

下载完成后,自动进入模型,直接在命令行输入问题,即可得到回复。

获取帮助

/?

退出对话

/bye

 

3.3.6 查看已有模型

代码如下

ollama list

后续要运行模型,仍然使用之前的命令

ollama run deepseek-r1:7b

 

3.3 使用客户端工具

本地部署好模型之后,在命令行操作还是不太方便,我们继 续使用一些客户端工具来使用。

我们使用 Cherry Studio,Cherry Studio 是一个支持多模型服务的桌面客户端,为专业用户而打造,内置 30 多个行业的智能助手,帮助用户在多种场景下提升工作效率。

Cherry Studio的下载地址:https://cherry-ai.com/

 

就直接傻瓜式安装。

然后我们以Cherry Studio为例访问7b的蒸馏模型。

 如何这里没有显示r1模型,那么说明你之前没有安装好,去重新安装。

然后去选择模型,值得注意的是,使用时要确保ollama客户端已启动

 

然后提问 ↓ ↓ ↓

4. 总结 

以上就是deepseek本地化部署的全部内容,部署流程参考B站尚硅谷 👇 👇 👇30-部署方式3:本地算力部署_哔哩哔哩_bilibili

更多内容点击下面链接查看 👇 👇 👇

专栏管理-CSDN创作中心

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18404.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

foobar2000设置DSP使用教程及软件推荐

foobar2000安卓中文版:一款高品质手机音频播放器 foobar2000安卓中文版是一款备受好评的高品质手机音频播放器。 几乎支持所有的音频格式,包括 MP3、MP4、AAC、CD 音频等。不论是经典老歌还是最新的流行音乐,foobar2000都能完美播放。除此之…

制作一个项目用于研究elementUI的源码

需求:修改el-tooltip的颜色,发现传递参数等方法都不太好用,也可以使用打断点的方式,但也有点麻烦,因此打算直接修改源码,把组件逻辑给修改了 第一步下载源码 源码地址 GitHub - ElemeFE/element: A Vue.j…

DDoS技术解析

这里是Themberfue 今天我们不聊别的,我们聊聊著名的网络攻击手段之一的 DDoS,看看其背后的技术细节。 DoS 了解 DDoS 前,先来讲讲 DoS 是什么,此 DoS 而不是 DOS 操作系统啊。1996年9月6日,世界第三古老的网络服务提供…

【学习资源】时间序列数据分析方法(1)

时间序列数据分析是一个有趣的话题,让我们多花一些时间来研究。此篇为第一篇文章。主要介绍特征提取方法、深度学习时序数据分析模型、参考资源。期望能帮助大家解决工业领域的相关问题。 1 特征提取方法:信号处理 (来源:INTELLIGENT FAULT DIAGNOSIS A…

0基础学LabVIEW

对于零基础的朋友来说,学习LabVIEW需要一个科学的学习路径和方法。通过观看优质的B站教程打好基础,再结合实际项目进行实践操作,能够快速提升LabVIEW的应用能力。以下是从入门到进阶的学习建议。 ​ 一、利用B站入门教程打基础 筛选优质教程…

微软AutoGen高级功能——Selector Group Chat

介绍 大家好,这次给大家分享的内容是微软AutoGen框架的高级功能Selector Group Chat(选择器群聊),"选择器群聊"我在给大家分享的这篇博文的代码中有所体现微软AutoGen介绍——Custom Agents创建自己的Agents-CSDN博客,但是并没有详…

高通推出骁龙游戏超级分辨率™:充分释放移动游戏性能,带来更持久的续航

Snapdragon Elite Gaming 一直致力于为每位用户打造卓越游戏体验。骁龙支持众多端游级特性,包括144FPS游戏体验、True 10-bit HDR支持的最高视觉质量的超流畅图形,让玩家可以畅享超10亿色的游戏体验。骁龙将许多移动端首创特性引入备受玩家喜爱的游戏中&…

HCIA项目实践--RIP的拓展配置

9.4.7 RIP的拓展配置 (1)RIPV2的手工认证 RIPv2 的手工认证是增强网络安全性的手段。管理员手动配置密钥,路由器在收发 RIPv2 路由更新消息时,会对消息中的认证信息进行检查。发送方添加密钥,接收方用预设密钥验证。若…

Jenkins 配置 Git Repository 五

Jenkins 配置 Git Repository 五 这里包含了 Freestyle project 任务类型 和 Pipeline 任务类型 关于 Git 仓库的配置,如下 不同的任务类型,只是在不同的模块找到 配置 Git 仓库 找到 Git 仓库配置位置之后,所有的任务类型配置都是一样的 …

Python + WhisperX:解锁语音识别的高效新姿势

大家好,我是烤鸭: 最近在尝试做视频的质量分析,打算利用asr针对声音判断是否有人声,以及识别出来的文本进行进一步操作。asr看了几个开源的,最终选择了openai的whisper,后来发现性能不行,又换了…

红队视角出发的k8s敏感信息收集——持久化存储与数据泄露

在Kubernetes集群中,持久化存储卷如同数据的保险箱,承载着应用运行所必需的各类敏感信息。然而,从红队视角出发,这些存储卷也可能成为攻击者觊觎的目标。通过巧妙地利用配置不当或已知漏洞,攻击者能够从中收集到包括密…

微信服务号推送消息

这里如果 没有 就需要点新的功能去申请一下 申请成功之后就可以设置模版消息 推送到用户接受的页面是 需要后端调用接口 传递token 发送给客户

[Spring] Spring常见面试题

🌸个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 🏵️热门专栏: 🧊 Java基本语法(97平均质量分)https://blog.csdn.net/2301_80050796/category_12615970.html?spm1001.2014.3001.5482 🍕 Collection与…

Edge浏览器清理主页

我们都知道,Microsoft Edge浏览器是微软创造的搜索浏览器,Windows10、11自带。但是你可以看到,每次你打开Edge浏览器的时候都可以看到许多的广告,如图: 导致打开Edge浏览器的时候会遭受卡顿,广告骚扰&#…

【编写UI自动化测试集】Appium+Python+Unittest+HTMLRunner​

简介 获取AppPackage和AppActivity 定位UI控件的工具 脚本结构 PageObject分层管理 HTMLTestRunner生成测试报告 启动appium server服务 以python文件模式执行脚本生成测试报告 下载与安装 下载需要自动化测试的App并安装到手机 获取AppPackage和AppActivity 方法一 …

Apollo 9.0 参考线生成器 -- ReferenceLineProvider

文章目录 1. Planning 与 Routing交互1.1 路由请求RoutingRequest1.2 路由响应RoutingResponse1.3 换道过程 2. 创建参考线线程2.1 创建参考线生成器2.2 启动参考线线程 3. 参考线周期生成3.1 创建参考线3.2 更新参考线 4. 参考线平滑4.1 设置中间点anchor points4.2 平滑算法平…

游戏引擎学习第103天

仓库:https://gitee.com/mrxiao_com/2d_game_2 回顾bug 接下来回顾一下这个bug的具体情况。当前是一个调试视图,我们并不是直接在调试视图下工作,而是在进行相关的调试。展示了地图,这里是环境贴图,上面是正在使用的环境贴图&am…

论文学习记录之《CLR-VMB》

目录 一、基本介绍 二、介绍 三、方法 3.1 FWI中的数据驱动方法 3.2 CLR-VMB理论 3.3 注意力块 四、网络结构 4.1 网络架构 4.2 损失函数 五、实验 5.1 数据准备 5.2 实验设置 5.3 训练和测试 5.4 定量分析 5.5 CLR方案的有效性 5.6 鲁棒性 5.7 泛化性 六、讨…

USART串口协议

USART串口协议 文章目录 USART串口协议1. 通信接口2.串口通信2.1硬件电路2.2电平标准2.3串口参数及时序(软件部分) 3.USART串口外设3.1串口外设3.2USART框图3.3USART基本结构3.4数据帧 4.输入电路4.1起始位侦测4.2数据采样 5.波特率发生器6.相关函数介绍…

【线性代数】1行列式

1. 行列式的概念 行列式的符号表示: 行列式的计算结果:一个数 计算模型1:二阶行列式 二阶行列式: 三阶行列式: n阶行列式: 🍎计算行列式 计算模型2:上三角形行列式 上三角形行列式特征:主对角线下皆为0。 上三角形行列式: 化上三角形通用方法:主对角线下,…