Windows电脑本地部署运行DeepSeek R1大模型(基于Ollama和Chatbox)

文章目录

  • 一、环境准备
  • 二、安装Ollama
    • 2.1 访问Ollama官方网站
    • 2.2 下载适用于Windows的安装包
    • 2.3 安装Ollama安装包
    • 2.4 指定Ollama安装目录
    • 2.5 指定Ollama的大模型的存储目录
  • 三、选择DeepSeek R1模型
  • 四、下载并运行DeepSeek R1模型
  • 五、常见问题解答
  • 六、使用Chatbox进行交互
    • 6.1 下载Chatbox安装包
    • 6.2 安装并启动 Chatbox
    • 6.3 配置Chatbox
  • 七、总结
    • 7.1 Ollama介绍
    • 7.2 Chatbox介绍

一、环境准备

电脑配置越高可以运行版本更高的DeepSeek R1模型。
DeepSeek R1模型版本越高,参数越多,模型越大,效果越好。

我的电脑配置如下

  • CPU:R7 5800
  • 显卡:RTX3060 12G独显
  • 内存:32G
  • 网络:需要稳定的互联网连接以下载模型文件。

二、安装Ollama

2.1 访问Ollama官方网站

  • Ollama官方网站:https://ollama.com/

在这里插入图片描述

在这里插入图片描述

2.2 下载适用于Windows的安装包

  • 单击右上角“Download”按钮

在这里插入图片描述

在这里插入图片描述

  • 官网如果下载的慢,可以选择网盘下载,方法如下。

关注【小康师兄】微信公众号,回复【Ollama】即可获取下载链接。

2.3 安装Ollama安装包

  • 双击安装包,按照安装向导的提示完成安装。
  • 安装完成后,可以在开始菜单中找到Ollama。

在这里插入图片描述

  • 不过这种方式只能安装在C盘(C:\Users\weijian\AppData\Local\Programs\Ollama)
  • 这个安装包还不够完善,没有选择安装路径的选项。

在这里插入图片描述

2.4 指定Ollama安装目录

  • 通过OllamaSetup.exe /dir="D:\Program Files\Ollama”命令可以指定Ollama安装目录
C:\Users\weijian>d:
D:\>cd “Program Files"
D:\Program Files>OllamaSetup.exe /dir="D:\Program Files\Ollama”

在这里插入图片描述

在这里插入图片描述

2.5 指定Ollama的大模型的存储目录

  • 打开 “开始” 菜单,搜索 “环境变量”,点击 “编辑系统环境变量”。
  • 在 “系统属性” 窗口中,点击 “环境变量” 按钮。
  • 在 “用户变量” 下,点击 “新建”,输入变量名 “ollama_models”,变量值为你想要存储模型的目录路径,如 “D:\ollama_models”,点击 “确定” 保存更改。
  • 若 Ollama 已经在运行,需先关闭托盘应用程序,然后从开始菜单重新启动,或在保存环境变量后启动新的终端。

三、选择DeepSeek R1模型

  • DeepSeek-R1有多种版本,适配不同的硬件配置(如下图)。
  • 主要取决于GPU的显存大小。
  • 注意:是GPU的显存,不是电脑的内存

在这里插入图片描述

  • 简单列举了几个高性能显卡的参数。
显卡 型号性能评级显存容量显存类型
RTX 4090S24GBGDDR6X
RX 7900 XTXS24GBGDDR6
RTX 4080 SUPERA+16GBGDDR6X
RX 7900 XTA+20GBGDDR6
RTX 4070 Ti SUPERA12GBGDDR6X
RX 7900 GREA16GBGDDR6
RTX 3090 TiA24GBGDDR6X
RX 6950 XTA16GBGDDR6
RTX 4070 TiA12GBGDDR6X
RX 7800 XTA-16GBGDDR6

四、下载并运行DeepSeek R1模型

  • 打开 Windows PowerShell(管理员)或终端管理员。
  • 输入以下命令下载模型(以 8B 版本为例):
ollama run deepseek-r1:8b

在这里插入图片描述

在这里插入图片描述

  • 下载完成后,模型会自动运行,您可以在终端与模型进行交互,输入问题或任务,模型将提供相应的响应。
  • 如果需要重新进入模型交互界面,可以在 PowerShell 中输入以下命令:
ollama run deepseek-r1:8b

在这里插入图片描述

五、常见问题解答

  • 模型加载时间过长:可能是由于硬件性能或网络速度限制。请确保系统满足模型的硬件要求,并检查网络连接。
  • 内存不足错误:考虑使用较小的模型版本或升级硬件配置。
  • 模型响应不准确:确保按照推荐的配置使用模型,例如将温度设置在 0.5-0.7 之间,并避免添加系统提示符。
  • 启动Ollama报错:Error: listen tcp 127.0.0.1:11434: bind: Only one usage of each socket address (protocol/network address/port) is normally permitted.
    • netstat -aon | findstr 11434:查找占用端口的进程。
    • tasklist | findstr "6892":查看该进程的详细信息。
    • taskkill /PID 6872 /F:杀死该进程。

六、使用Chatbox进行交互

6.1 下载Chatbox安装包

  • 访问Chatbox官方网站(https://chatboxai.app/zh),下载适用于 Windows 的版本。

在这里插入图片描述

6.2 安装并启动 Chatbox

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

6.3 配置Chatbox

  • API类型:选择 “OLLAMA API”。
  • 接口地址:填写 http://localhost:11434。
  • 模型名称:填写 deepseek-r1:8b,确保与之前下载的模型版本一致。

在这里插入图片描述

在这里插入图片描述

  • 最后就可以在本地使用DeepSeek R1模型啦

在这里插入图片描述

七、总结

主要使用两个开源软件,才将DeepSeek R1大模型运行起来。

7.1 Ollama介绍

Ollama 是一个开源的框架,主要用于在本地机器上便捷地部署和运行大型语言模型(LLM)。以下是关于 Ollama 的详细介绍:

  • 简化部署:Ollama的设计目标是简化在Docker容器中部署大型语言模型的过程,使得非专业用户也能方便地管理和运行这些复杂的模型。
  • 轻量级与可扩展:作为一个轻量级框架,Ollama保持了较小的资源占用,同时具备良好的可扩展性,允许用户根据需要调整配置以适应不同规模的项目和硬件条件。
  • API 支持:Ollama提供了一个简洁的API,使得开发者能够轻松创建、运行和管理大型语言模型实例,降低了与模型交互的技术门槛。
  • 预构建模型库:Ollama包含一系列预先训练好的大型语言模型,用户可以直接选用这些模型应用于自己的应用程序,无需从头训练或自行寻找模型源。
  • 模型导入与定制:Ollama支持从特定平台(如GGUF)或其他深度学习框架(如PyTorch或Safetensors)导入已有的大型语言模型,并允许用户为模型添加或修改提示(prompt engineering)

7.2 Chatbox介绍

Chatbox 是一款开源的聊天界面工具,专为与本地运行的大型语言模型(如 Ollama、Llama、Vicuna 等)进行交互而设计。

它提供了一个简单易用的图形用户界面(GUI),使用户能够更方便地与本地部署的语言模型进行对话,而无需编写复杂的代码或使用命令行工具。


若觉得文章对你有帮助,随手『点赞』、『收藏』、『关注』,也是对我的支持。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13179.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

洛谷网站: P3029 [USACO11NOV] Cow Lineup S 题解

题目传送门: P3029 [USACO11NOV] Cow Lineup S - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 前言: 这道题的核心问题是在一条直线上分布着不同品种的牛,要找出一个连续区间,使得这个区间内包含所有不同品种的牛,…

如何利用maven更优雅的打包

最近在客户现场部署项目,有两套环境,无法连接互联网,两套环境之间也是完全隔离,于是问题就来了,每次都要远程到公司电脑改完代码,打包,通过网盘(如果没有会员,上传下载慢…

360手机刷机 360手机解Bootloader 360手机ROOT

360手机刷机 360手机解Bootloader 360手机ROOT 问:360手机已停产,现在和以后,能刷机吗? 答:360手机,是肯定能刷机的 360手机资源下载网站 360手机-360手机刷机RootTwrp 360os.top 360rom.github.io 一、…

8.攻防世界Web_php_wrong_nginx_config

进入题目页面如下 尝试弱口令密码登录 一直显示网站建设中,尝试无果,查看源码也没有什么特别漏洞存在 用Kali中的dirsearch扫描根目录试试 命令: dirsearch -u http://61.147.171.105:53736/ -e* 登录文件便是刚才登录的界面打开robots.txt…

排序算法--计数排序

唯一种没有比较的排序(指没有前后比较,还是有交换的)。统计每个元素出现的次数,直接计算元素在有序序列中的位置,要求数据是整数且范围有限。适用于数据为小范围整数(如年龄、成绩),数据重复率较高时效率更优。可用于小…

PyTorch快速入门

Anaconda Anaconda 是一款面向科学计算的开源 Python 发行版本,它集成了众多科学计算所需的库、工具和环境管理系统,旨在简化包管理和部署,提升开发与研究效率。 核心组件: Conda:这是 Anaconda 自带的包和环境管理…

树莓派卷积神经网络实战车牌检测与识别

文章目录 树莓派介绍1. 树莓派的硬件规格2. 树莓派的操作系统3. 树莓派的应用场景 研究背景一、效果演示1.0 项目获取1.1 图像识别1.2 视频识别 二、技术原理2.1 整体流程2.2 CCPD数据集介绍2.3 车牌定位2.4 车牌矫正2.5 车牌识别2.5.1 CRNN概述2.5.2 CRNN网络架构实现2.5.3 CN…

Redis入门概述

1.1、Redis是什么 Redis:官网 高性能带有数据结构的Key-Value内存数据库 Remote Dictionary Server(远程字典服务器)是完全开源的,使用ANSIC语言编写遵守BSD协议,例如String、Hash、List、Set、SortedSet等等。数据…

如何在自己电脑上私有化部署deep seek

要在自己的电脑上私有化部署 DeepSeek,通常需要以下步骤: 1. 环境准备 操作系统:确保你的电脑操作系统支持 Docker 或直接安装 Python 环境(如 Linux、Windows 或 macOS)。 Python 环境:安装 Python 3.7 …

【办公类-99-01】20250201学具PDF打印会缩小一圈——解决办法:换一个PDF阅读器

背景需求: 2024年1月13日,快要放寒假了,组长拿着我们班的打印好的一叠教案来调整。 “前面周计划下面的家园共育有调整,你自己看批注。” “还有你这个教案部分的模版有问题,太小(窄)了。考虑…

k8s集群

文章目录 项目描述项目环境系统与软件版本概览项目步骤 环境准备IP地址规划关闭selinux和firewall配置静态ip地址修改主机名添加hosts解析 项目步骤一、使用kubeadm安装k8s单master的集群环境(1个master2个node节点)1、互相之间建立免密通道2.关闭交换分…

HTTP和HTTPS协议详解

HTTP和HTTPS协议详解 HTTP详解什么是http协议http协议的发展史http0.9http1.0http1.1http2.0 http协议的格式URI和URL请求request响应response http协议完整的请求与响应流程 HTTPS详解为什么使用HTTPSSSL协议HTTPS通信过程TLS协议 HTTP详解 什么是http协议 1、全称Hyper Tex…

2025开源DouyinLiveRecorder全平台直播间录制工具整合包,多直播同时录制、教学直播录制、教学视频推送、简单易用不占内存

一、DouyinLiveRecorder软件介绍(文末提供下载) 官方地址:GitHub - ihmily/DouyinLiveRecorder 本文信息来源于作者GitHub地址 一款简易的可循环值守的直播录制工具,基于FFmpeg实现多平台直播源录制,支持自定义配置录制…

学习threejs,pvr格式图片文件贴图

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:threejs gis工程师 文章目录 一、🍀前言1.1 ☘️PVR贴图1.2 ☘️THREE.Mesh…

Beans模块之工厂模块注解模块CustomAutowireConfigurer

博主介绍:✌全网粉丝5W,全栈开发工程师,从事多年软件开发,在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战,博主也曾写过优秀论文,查重率极低,在这方面有丰富的经验…

(一)DeepSeek大模型安装部署-Ollama安装

大模型deepseek安装部署 (一)、安装ollama curl -fsSL https://ollama.com/install.sh | sh sudo systemctl start ollama sudo systemctl enable ollama sudo systemctl status ollama(二)、安装ollama遇到网络问题,请手动下载 ollama-linux-amd64.tgz curl -L …

使用Pygame制作“贪吃蛇”游戏

贪吃蛇 是一款经典的休闲小游戏:玩家通过操控一条会不断变长的“蛇”在屏幕中移动,去吃随机出现的食物,同时要避免撞到墙壁或自己身体的其他部分。由于其逻辑相对简单,但可玩性和扩展性都不错,非常适合作为新手练习游戏…

【prompt实战】AI +OCR技术结合ChatGPT能力项目实践(BOL提单识别提取专家)

本文原创作者:姚瑞南 AI-agent 大模型运营专家,先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。(转载需经授权) 目录 1. 需求背景 2. 目标 3. BOL通用处理逻辑…

dl学习笔记(8):fashion-mnist

过完年懒羊羊也要复工了,这一节的内容不多,我们接着上次的fashion-mnist数据集。 首先第一步就是导入数据集,由于这个数据集很有名,是深度学习的常见入门数据集,所以可以在库里面导入。由于是图像数据集所以&#xff…

【Rust自学】20.2. 最后的项目:多线程Web服务器

说句题外话,这篇文章非常要求Rust的各方面知识,最好看一下我的【Rust自学】专栏的所有内容。这篇文章也是整个专栏最长(4762字)的文章,需要多次阅读消化,最好点个收藏,免得刷不到了。 喜欢的话…