️ 在 Windows WSL 上部署 Ollama 和大语言模型的完整指南20241206

🛠️ 在 Windows WSL 上部署 Ollama 和大语言模型的完整指南

📝 引言

随着大语言模型(LLM)和人工智能的飞速发展,越来越多的开发者尝试在本地环境中部署大模型进行实验。然而,由于资源需求高、网络限制多以及工具复杂性,部署过程常常充满挑战。

本指南基于实际经验,详细讲解如何在 Windows WSL(Windows Subsystem for Linux) 上部署 Ollama 和大语言模型,同时解决端口转发等常见痛点,实现局域网内多设备访问。
无论您是 AI 技术新手、行业从业者,还是 经验丰富的专家,这篇文章都能提供全面的指南、实践经验与优化建议。

在这里插入图片描述

⭐ 1.为什么选择 WSL 部署大模型?

1.1 性能优势

👉 WSL 的设计目标是高效:

  • WSL 利用 Windows 内核直接运行 Linux 环境,性能接近原生 Linux。
  • 支持 NVIDIA GPU 加速(如 4070 Super),运行大语言模型毫无压力。

1.2 易用性

  • 轻量级:无需像 VMware 或 VirtualBox 那样安装完整的虚拟机。
  • 集成度高:与 Windows 文件系统和网络无缝结合。
  • 简单维护:直接通过 Windows Store 更新 WSL。

1.3 实际适用性

  • 开发者首选:对于想快速部署和运行模型的开发者,WSL 是简单且高效的选择。

⚙️ 2.实现目标的挑战与应对策略

2.1 核心目标

  • 1.在 WSL 中部署 Ollama 服务,加载千问模型。
  • 2.配置 OpenWebUI,提供交互界面。
  • 3.实现局域网访问,让家庭中所有设备通过浏览器访问服务。

2.2 挑战分析

  • 1.资源限制:下载 Docker 镜像和大模型文件难度较大。
  • 2.端口转发不稳定:动态 IP 和 Windows 防火墙会导致转发失败。
  • 3.服务访问受限:默认服务仅绑定 127.0.0.1,无法被局域网设备访问。

2.3 应对策略

✅ 镜像与模型下载:通过云服务器下载资源并传输至本地。
✅ 端口转发优化:编写脚本动态更新转发规则,避免手动配置。
✅ 服务绑定调整:绑定到 0.0.0.0 地址,允许外部设备访问。

📋 3.实践:在 WSL 上部署 Ollama 和千问模型

3.1 准备资源与环境

资源清单 📂

  • 1.Docker 镜像:docker-images-openwebui.tar。
  • 2.Ollama 可执行文件:ollama-linux-amd64。
  • 3.千问模型文件:Modelfile llama3.1 8b chinese_chat f16.gguf。

环境准备

1. 安装 WSL 与 Docker:
sudo apt update
sudo apt install -y docker.io
sudo service docker start
2. 测试 Docker 是否正常工作:
docker run hello-world
3. 将资源传输到 WSL:
cp /mnt/c/Users/<your_username>/Downloads/docker-images-openwebui.tar ~/
cp /mnt/c/Users/<your_username>/Downloads/ollama-linux-amd64 ~/
cp /mnt/c/Users/<your_username>/Downloads/Modelfile-llama3.1-8b-chinese_chat-f16.gguf ~/

3.2 加载 Docker 镜像与配置模型

加载 Docker 镜像

docker load -i ~/docker-images-openwebui.tar
docker images

安装 Ollama

mv ~/ollama-linux-amd64 /usr/local/bin/ollama
chmod +x /usr/local/bin/ollama
ollama version

配置模型

mkdir -p ~/.ollama
mv ~/Modelfile-llama3.1-8b-chinese_chat-f16.gguf ~/.ollama/
ollama serve

3.3 启动服务并设置局域网访问

启动 OpenWebUI 容器

docker run -d --name openwebui \-p 8080:8080 \-v ~/.ollama:/app/backend/data \openwebui:latest

访问服务

•	本地访问:http://localhost:8080
•	局域网访问:通过端口转发或绑定所有地址实现。

🔧4. WSL 的端口转发问题及优化解决方案

4.1 动态 IP 的困扰

在 /etc/wsl.conf 文件中固定 WSL 子网:

[network]
generateResolvConf = false
subnet = 192.168.50.0/24

重启 WSL 后验证新 IP 是否生效。

4.2 自动化脚本

每次启动 WSL 自动更新端口转发规则:

#!/bin/bash
wsl_ip=$(ip addr | grep 'inet ' | grep -v '127.0.0.1' | awk '{print $2}' | cut -d/ -f1)
powershell.exe -Command "netsh interface portproxy add v4tov4 listenaddress=0.0.0.0 listenport=8080 connectaddress=$wsl_ip connectport=8080"

4.3 使用反向代理

在 Windows 主机上安装 Nginx,配置反向代理到 WSL 的服务地址:

server {listen 80;server_name localhost;location / {proxy_pass http://192.168.50.100:8080;proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;}
}

📊 对比分析:WSL vs VMware vs VirtualBox

特性WSLVMware WorkstationVirtualBox
性能⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
GPU 支持⭐⭐⭐⭐⭐⭐⭐⭐
易用性⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
免费使用⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐

📝 结论与展望

🌟 总结

  • 核心目标:通过部署 Ollama 和大语言模型,为你提供高效的实验和实践环境,同时应对实际开发中的常见问题。
  • 解决思路:基于 WSL 的轻量化部署方案,结合实际硬件条件,通过优化工具链和环境配置,解决端口转发、动态 IP、不稳定的网络连接等问题。
  • 部署工具选择
    • WSL 是快速部署和测试的最佳选择。
    • VMware 适合需要长期运行和资源隔离的场景。
    • VirtualBox 在预算受限和轻量任务中可作为备选。

🔍 展望

  • 为开发者提供解决问题的思路

    • 聚焦实际开发中的痛点问题,例如 WSL 的端口转发不稳定、资源调度困难等,提供清晰的解决步骤。
    • 通过脚本化、自动化配置和硬件资源优化,减少开发者的重复性工作。
  • 启发具体问题的解决方案

    • 针对端口映射问题,提出动态脚本更新的方案,避免配置失效。
    • 在 GPU 和模型加载方面,利用量化技术降低资源消耗,为硬件条件受限的开发者提供有效的策略。

本文旨在通过分享实践心得与创新思考,助力你在技术探索的征途中,轻松跨越障碍,加速实验进程,让创意与成果璀璨绽放。🎯

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/485608.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

buuctf:rar

根据题目所示&#xff0c;直接进行爆破 爆破后密码是8795,解压后得到flag flag{1773c5da790bd3caff38e3decd180eb7}

李飞飞空间智能来了:AI生成可探索交互的3D世界,颠覆游戏电影VR行业

目录 前言图生世界摄影效果景深效果滑动变焦 3D效果交互效果动画效果 走进大师的艺术工作流总结 前言 12月3日&#xff0c;有AI“教母”之称的李飞飞发布了空间智能的一个项目&#xff0c;一经发布就立刻引爆了外网。这个项目是仅仅通过一张图片&#xff0c;AI就可以快速的构建…

dockerfile部署前后端(vue+springboot)

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言0.环境说明和准备1.前端多环境打包1.1前端多环境设置1.2打包 2.后端项目多环境配置以及打包2.1后端多环境配置2.2项目打包 3.文件上传4.后端镜像制作4.1dockerf…

Numpy基础练习

import numpy as np 1.创建一个长度为10的一维全为0的ndarray对象,然后让第5个元素等于1 n np.zeros(10,dtypenp.int32) n[4] 12.创建一个元素从10到49的ndarray对象 n np.arrange(10,50)3.将第2题的所有元素位置反转 n[::-1]使用np.random.random创建一个10*10的ndarray对象…

MongoDB分片集群搭建及扩容

分片集群搭建及扩容 整体架构 环境准备 3台Linux虚拟机&#xff0c;准备MongoDB环境&#xff0c;配置环境变量。一定要版本一致&#xff08;重点&#xff09;&#xff0c;当前使用 version4.4.9 配置域名解析 在3台虚拟机上执行以下命令&#xff0c;注意替换实际 IP 地址 e…

Java项目实战II基于微信小程序的亿家旺生鲜云订单零售系统的设计与实现(开发文档+数据库+源码)

目录 一、前言 二、技术介绍 三、系统实现 四、核心代码 五、源码获取 全栈码农以及毕业设计实战开发&#xff0c;CSDN平台Java领域新星创作者&#xff0c;专注于大学生项目实战开发、讲解和毕业答疑辅导。获取源码联系方式请查看文末 一、前言 随着移动互联网技术的不断…

数据结构与算法-03链表-03

递归与迭代 由一个问题引出 假设我们要计算 一个正整数的阶乘, N! 。 从数学上看 1&#xff01; 1 2&#xff01; 2 x 1 3! 3 x 2 x 1 4! 4 x 3 x 2 x 1 5! 5 x 4 x 3 x 2 x 1 : n! n x (n-1) x (n-2) x (n-3) x ... 1我们推出一般公式 f(1) 1 f(n) n * f(n-1…

Unity 设计模式-观察者模式(Observer Pattern)详解

观察者模式 观察者模式&#xff08;Observer Pattern&#xff09;是一种行为型设计模式&#xff0c;它定义了对象之间的一对多依赖关系。当一个对象的状态发生变化时&#xff0c;它的所有依赖者&#xff08;观察者&#xff09;都会收到通知并自动更新。这种模式用于事件处理系…

第四篇:k8s 理解Service工作原理

什么是service&#xff1f; Service是将运行在一组 Pods 上的应用程序公开为网络服务的抽象方法。 简单来说K8s提供了service对象来访问pod。我们在《k8s网络模型与集群通信》中也说过k8s集群中的每一个Pod&#xff08;最小调度单位&#xff09;都有自己的IP地址&#xff0c;都…

地瓜RDK X5上手ollama大模型测试

地瓜RDK X5上手ollama大模型测试 契机 ⚙ 上次逛ollama的时候发现有很多小参数的大模型&#xff0c;比如qwen2:0.5b,llama3.2:1b&#xff0c;甚至还有一个1.8b的多模态模型moondream&#xff0c;找公司1拿到一块RDK X5的开发板&#xff0c;官网查看算力可达10TOPS&#xff0c…

【Java】反射简介

框架的核心和架构师的核心 反射和代理是重中之重 反射 反射的作用 在运行的时候由代码获取类的信息 三种获取类信息的方式&#xff1a; 对象.getClass()Class.forName("类的路径")类.class Class &#xff1a;一个用来存储类信息的类 获取类信息是获取的整体的…

Windows电脑伪关机(快速启动模式),怎么真关机

Windows电脑在关机的时候&#xff0c;进入到一个伪关机的状态&#xff0c;也就是并没有真正的关机&#xff0c;但是在一些系统更新、变更了一些设置&#xff0c;进行重启等操作也会进入到真关机状态 这种一般是开启快速启动模式&#xff0c;开启了快速启动模式功能会在关机的时…

在c#控制台中使用Raylib-cs库,绘制控制小球和插入音频(附带c++中小球的控制代码)

下载网址 GitHub - chrisdill/raylib-cs: C# bindings for raylib, a simple and easy-to-use library to learn videogames programming 克隆库 克隆GitHub仓库-CSDN博客 1 .制作dll 点击 生成之后就会多出这些东西 2.在项目中添加dll 然后就导进来了 测试一下用例代码 …

【开源免费】基于Vue和SpringBoot的服装生产管理系统(附论文)

博主说明&#xff1a;本文项目编号 T 066 &#xff0c;文末自助获取源码 \color{red}{T066&#xff0c;文末自助获取源码} T066&#xff0c;文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析…

【漫话机器学习系列】Adaboost算法

Adaboost&#xff08;Adaptive Boosting&#xff09;是一种经典的集成学习方法&#xff0c;主要思想是通过将多个弱学习器&#xff08;通常是简单模型&#xff0c;如决策树桩&#xff09;加权组合&#xff0c;来提升整体模型的预测能力。Adaboost 是一种自适应的学习方法&#…

WebStorm快捷键保持跟Idea一致

修改连续行局部多选 在WebStorm中同时按下ctrl alt s&#xff1b; 选择KeyMap 输入Column Selection Mode选择快捷键, 右键选择Add Mouse Shortcut 按下alt 鼠标左键 如果出现占用的情况&#xff0c;直接删除其他使用该快捷键的地方即可&#xff1b; 修改跨行局部多选 在…

图的遍历之DFS邻接矩阵法

本题要求实现一个函数&#xff0c;对给定的用邻接矩阵存储的无向无权图&#xff0c;以及一个顶点的编号v&#xff0c;打印以v为起点的一个深度优先搜索序列。 当搜索路径不唯一时&#xff0c;总是选取编号较小的邻接点。 本题保证输入的数据&#xff08;顶点数量、起点的编号等…

如何解决java.lang.UnsatisfiedLinkError:org.hyperic.sigar.ProcStat.gather问题

在新装的centos7.4服务器上部署部署应用系统&#xff0c;应用系统系统启动报错&#xff1a;“java.lang.UnsatisfiedLinkError:org.hyperic.sigar.ProcStat.gather” 一、报错分析 java.lang.UnsatisfiedLinkError通常是由于Java程序无法找到、加载或链接到所需的本地库而引发的…

Qt Chart 模块化封装曲线图

一 版本说明 此文档会从头到尾演示创建初始化流程 二 完成示例 此文章包含:曲线轴设置,曲线切换,单条曲线显示,坐标轴。。。 三 曲线图UI创建 在UI界面拖放一个QWidget,然后在 Widget里面放一个 graphicsView 四 代码介绍 1 头文件 #include <QString> #includ…

【时时三省】(C语言基础)结构体内存对齐

山不在高&#xff0c;有仙则名。水不在深&#xff0c;有龙则灵。 ----CSDN 时时三省 我们已经掌握了结构体的基本使用了。现在我们深入讨论一个问题&#xff1a;计算结构体的大小。 这也是一个特别热门的考点&#xff1a;结构体内存对齐 示例&#xff1a; 第一个s如果根据字…