在本地顺利的部署一个al模型从零开始 windows

引言 (踩的坑,省流引言的内容没有有使模型跑起来)

最近想在本地部署一个deepseek模型,就在网上搞了3 4天终于是能够部署下来了,在部署的时候也是成功的踩了无数的坑,比如我先问al如何在本地部署一个语言模型,al给我的建议是,先去hugging face中下好你要的模型,当然hugging face是访问不了的,要访问进行hf_mirror这个,然后去复制模型的下载链接然后我得到了这个

只有这个python下载链接不行的,,所以要去下transformers这个库,那么如何下呢,答:使用pip指令,pip嘛是python的一个下载各种插件的工具好用,下载工具就一行代码 pip install transformers

但是当我下好pip之后发现下载慢的要死,原来是他是在hugging face.co这里下载的,nnd这个网站我科学上网都进不去,得用国内镜像源

https://hf-mirror.com

,后来发现改为全球节点才进去nnd,

pip install transformers 来下载,结果慢得要死,配置下国内源

pip config set global.index-url='https://mirrors.aliyun.com/pypi/simple/'

改为alli的镜像下载快多了,之前kb的现在几十mb 可以使用pip config list来看是否配置好了

把transformers下好之后,复制代码就去使用,md下半天没有下好,一看报错,好家伙又要访问hugging face.io去下载,于是我寻思那就科学上网

下吧(我已经下过了)有俩个model要下载,shards0/2看出来的,一共14个g,然后发现去找发现可以使用国内的镜像网站去下 而且我没时间了hh

https://hf-mirror.com

又去配置了下国内源

这个是临时的,结果搞笑了

居然下不了,国内的源的下不了了,神奇了,那我前俩天咋下的,不过也没事,反正我下下来了也跑不起,报的错我还记得,文件空间不够,意思是我的内存不够了,得 哦对我的是笔记本

i9-13900hx和4060的,然后又想到ai给我说的要量化的 得量化为4-bit的,然后就又去搞怎么量化

去问,哈要用到bitsandbytes 这个工具,又去下了这个工具 pip install bitsandbytes ,然后还需要pytorch 和cuda,pytorch 和cuda 这俩可真是一个无敌大坑,作用是cuda给你的程序提供gpu算力支持,pytorch,用python代码使用cuda(我的理解哈,也不大懂的),我之前不知道适配的事,下了个12.3,又去看pytorch,傻眼了

感觉不支持的验证,但是为了保险起见,我删了cuda12.3下为了12.4,pytorch下支持cuda12.4的

cuda下好之后,cuda的环境变量啥的都搞的服服帖帖的

pytorch是用他给的指令下慢得不行,于是使用镜像源下,

pip3 install torch torchvision torchaudio --index-url https://mirrors.aliyun.com/pypi/simple//whl/cu124

下好之后,觉得成了,在python中运行nnd已运行报错

一问ai问的是deepseek,说的bitsandbytes无法使用cuda,然后去检查这里pytorch和cuda是否适配,结果不适配,然后就各种问ai,删了重下,啥的,后面刷到个帖子,说不要用镜像源的源来下,就得用给指令的来下,我看他倒是成了,我这样搞,不行,就是不适配,然后我就怀疑是windows系统的错hh,因为ai和搜到的大多给我的都是bash指令,是类 Unix 操作系统,Linux的标准命令工具,当然这是我搞了2 3天不成功之后气的给的理由,然后放弃了这条路,还是ollama好用,还有在图形化运行模型的时候,全是给我推荐的是使用docker容器来运行,也是去搞了下,开始的时候发现不呢正常运行,为什么呢,一看原来是没有启动hyper-v这东西是linux的,要创造个虚拟机来运行,那就去启动把,一看傻眼了

没有hyper-v

后面又去搜 使用这行命令安装的

Enable-WindowsOptionalFeature -Online -FeatureName Microsoft-Hyper-V -All

之后docker能用了,去运行时要是使用openwebui,然后openwebui也是有现成的给我用

都是在docker中下openwebui的,一用,慢的要死,最后等他下好全部都下玩了有个一下午把,结果又失败了,果断放弃,使用pip下载openwebui,几分钟就解决了,ok我能想到的坑就先这多了,现在进入正题

正题

在python中创建一个项目

这里自动给我给创建了虚拟环境,有个虚拟环境,这样你在这个环境入无论咋折腾对外都不会有什么影响,在部署模型的时候也容易对依赖下了右删,删了又下的,还不错

运行虚拟环境 

F:\virtual_env\v2\.venv\Scripts

这样就成功了

还有更方便的

下载open-webui 这个是用来图形化使用模型的,你也不想对个黑框框对话把

pip install open-webui

下载ollama,在ollama中下载模型

Ollama

下载好ollama软件之后,

这里下载模型

复制这个连接在cmd中运行,当然要确保ollama 已经启动可以使用

ollama serve启动和确认

这样就是成功启动了 输入复制的下载

成功之后会会这样就代表模型运行起来了可以进行对话了

我刚刚直接退出了,也可以这样运行

启动open-webui服务

open-webui serve

他会自动连接ollama的

这样就启动成功了 访问http://127.0.0.1:8080就能进行对话了

一些错误的解决

在启动的过程中可能会有个报错 比如这个

他说的是 OpenMP这个库被多次初始化,我的解决方案比较粗暴 设置这个环境变量

KMP_DUPLICATE_LIB_OK=TRUE 告诉OpenMp运行库可以重复初始化

具体是

cmd:setx KMP_DUPLICATE_LIB_OK TRUE 这是设置的是永久的环境变量

再次运行当然有可能失败,有点神奇可以这样搞

这样是设置的是临时的环境变量,是用os.system("set KMP_DUPLICATE_LIB_OK=TRUE") 不行,有点神奇,我这样就不行

在启动时 还可能有这个错误

open-webui会在启动的时候访问hugging face.co这个网站,可是访问不了的,那就会等到访问失败才会去链接本地的模型,会大大增加启动的时间,我算了下,访问了启动会需要大约3分钟才会启动,而直接加载本地的大约10秒就好了

比如这样

我的解决是增加了这个环境变量

DISABLE_MODEL_DOWNLOAD = true 

也是有点神奇我早上运行可以,中午不行,晚上把他搞为永久的变量了之后又可以了

也就是

setx DISABLE_MODEL_DOWNLOAD true

反正这些环境变量我使用set这个指令来进行配置都不行,运行结果都是错的,很神奇 

end~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13521.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于ansible部署elk集群

ansible部署 ELK部署 ELK常见架构 (1)ElasticsearchLogstashKibana:这种架构是最常见的一种,也是最简单的一种架构,这种架构通过Logstash收集日志,运用Elasticsearch分析日志,最后通过Kibana中…

Linux学习笔记16---高精度延时实验

延时函数是很常用的 API 函数,在前面的实验中我们使用循环来实现延时函数,但是使用循环来实现的延时函数不准确,误差会很大。虽然使用到延时函数的地方精度要求都不会很严格( 要求严格的话就使用硬件定时器了 ) ,但是延时函数肯定…

Linux系统 环境变量

环境变量 写在前面概念查看环境变量main函数的参数argc & argvenv bash环境变量 写在前面 对于环境变量,本篇主要介绍基本概念及三四个环境变量 —— PATH、HOME、PWD。其中 PATH 作为 “ 敲门砖 ”,我们会更详细讲解;理解环境变量的全局…

旋转变压器工作及解调原理

旋转变压器 旋转变压器是一种精密的位置、速度检测装置,广泛应用在伺服控制、机器人、机械工具、汽车、电力等领域。但是,旋转变压器在使用时并不能直接提供角度或位置信息,需要特殊的激励信号和解调、计算措施,才能将旋转变压器…

【漫话机器学习系列】076.合页损失函数(Hinge Loss)

Hinge Loss损失函数 Hinge Loss(合页损失),也叫做合页损失函数,广泛用于支持向量机(SVM)等分类模型的训练过程中。它主要用于二分类问题,尤其是支持向量机中的优化目标函数。 定义与公式 对于…

基于docker搭建Kafka集群,使用KRaft方式搭建,摒弃Zookeeper

KAFKA基于docker使用KRaft进行集群搭建 环境:已成功搭建kafka服务 可点击链接跳转至安装kafka-3.8.0版本 并启用SASL认证 教程 使用基于Zookeeper方式搭建集群教程 kafka-3.8.0版本 并启用SASL认证 教程 搭建kafka-ui可视化工具 192.168.2.91 192.168.2.92 192…

Go 语言 | 入门 | 快速入门

快速入门 1.第一份代码 先检查自己是否有正确下载 Go,如果没有直接去 Go 安装 进行安装。 # 检查是否有 Go $ go version go version go1.23.4 linux/amd64然后根据 Go 的入门教程 开始进行学习。 # 初始化 Go 项目 $ mkdir example && cd example # Go…

凝思60重置密码

凝思系统重置密码 - 赛博狗尾草 - 博客园 问题描述 凝思系统进入单用户模式,在此模式下,用户可以访问修复错误配置的文件。也可以在此模式下安装显卡驱动,解决和已加载驱动的冲突问题。 适用范围 linx-6.0.60 linx-6.0.80 linx-6.0.100…

HTML 复习

文章目录 路径问题标题标签段落标签换行标签列表标签<ol> 有序列表<ul> 无序标签标签嵌套 超链接标签多媒体标签<img> 图片标签<audio> 音频标签<video> 视频标签 表格标签<colspan> 跨行<rowspan> 跨列组合使用 表单标签基本表单标…

hot100(8)

71.10. 正则表达式匹配 - 力扣&#xff08;LeetCode&#xff09; 动态规划 题解&#xff1a;10. 正则表达式匹配题解 - 力扣&#xff08;LeetCode&#xff09; 72.5. 最长回文子串 - 力扣&#xff08;LeetCode&#xff09; 动态规划 1.dp数组及下标含义 dp[i][j] : 下标i到…

114,【6】攻防世界 web wzsc_文件上传

进入靶场 传个桌面有的 直接空白了 我们 访问一下上传的东西 /index 没显示用于解析的.htaccess和.user.ini 文件&#xff0c;还两个都不显示 但上传的时候bp查看状态码是200&#xff0c;意味着上传成功了 别的博主说这是服务器在短时间内就立刻将其删掉了&#xff0c;需…

禅道社区版项目管理软件部署(记录篇)

系统要求&#xff08;这里推荐使用docker容器化方式&#xff09;安装前的准备Docker快速安装最后通过查看地址验证是否部署成功开始界面化安装配置 禅道&#xff08;ZenTao&#xff09;是一款国产开源的项目管理软件&#xff0c;专注于敏捷开发流程&#xff0c;支持 Scrum 和 K…

B站自研的第二代视频连麦系统(上)

导读 本系列文章将从客户端、服务器以及音视频编码优化三个层面&#xff0c;介绍如何基于WebRTC构建视频连麦系统。希望通过这一系列的讲解&#xff0c;帮助开发者更全面地了解 WebRTC 的核心技术与实践应用。 背景 在文章《B站在实时音视频技术领域的探索与实践》中&#xff…

Selenium记录RPA初阶 - 基本输入元件

防止自己遗忘&#xff0c;故作此为记录。 爬取网页基本元件并修改后爬取。 包含元件&#xff1a; elements: dict[str, str] {"username": None,"password": None,"email": None,"website": None,"date": None,"ti…

Ubutun本地部署DeepSeek R1

目录 一、本地部署&终端命令行交互 二、网页端交互 三、参考链接 一、本地部署&终端命令行交互 Ollama 是一个轻量级的大语言模型管理工具&#xff0c;支持 Windows / Mac / Linux。 Ollama官网&#xff1a;Ollama # 下载安装ollama curl -fsSL https://ollama.co…

NacosRce到docker逃逸实战

NacosRce到docker逃逸实战 1、Nacos Derby Rce打入内存马 这个漏洞的原理大家应该都知道&#xff0c; 2.3.2 < Nacos < 2.4.0版本默认derby接口未授权访问&#xff0c;攻击者可利用未授权访问执行SQL语句加载构造恶意的JAR包导致出现远程代码执行漏洞。 在日常的漏洞挖…

保姆级教程Docker部署KRaft模式的Kafka官方镜像

目录 一、安装Docker及可视化工具 二、单节点部署 1、创建挂载目录 2、运行Kafka容器 3、Compose运行Kafka容器 4、查看Kafka运行状态 三、集群部署 四、部署可视化工具 1、创建挂载目录 2、运行Kafka-ui容器 3、Compose运行Kafka-ui容器 4、查看Kafka-ui运行状态 …

[创业之路-286]:《产品开发管理-方法.流程.工具 》-1- IPD两个跨职能团队的组织

IPD&#xff08;集成产品开发&#xff09;中的两个重要跨职能组织是IPMT&#xff08;集成产品管理团队&#xff09;和PDT&#xff08;产品开发团队&#xff09;。 在IPD&#xff08;集成产品开发&#xff09;体系中&#xff0c;IRB&#xff08;投资评审委员会&#xff09;、IPM…

【基于SprintBoot+Mybatis+Mysql】电脑商城项目之修改密码和个人资料

&#x1f9f8;安清h&#xff1a;个人主页 &#x1f3a5;个人专栏&#xff1a;【Spring篇】【计算机网络】【Mybatis篇】 &#x1f6a6;作者简介&#xff1a;一个有趣爱睡觉的intp&#xff0c;期待和更多人分享自己所学知识的真诚大学生。 目录 &#x1f383;1.修改密码 -持久…