阿里Qwen2开源大模型本地部署及调试全攻略

@阿里Qwen2开源大模型本地部署及调试全攻略

#Qwen2系列大模型性能卓越,超越业界知名模型。开源后受到AI开发者关注,支持多种语言,提升多语言理解。在预训练和微调上优化,实现智能水平提升。Qwen2系列模型在各项能力上均领先,为全球开发者提供更多选择。

通义千问 Qwen2,登顶国内第一大模型!相比近期推出同等规模的开源最好的Llama3-8B、GLM4-9B等模型,Qwen2-7B-Instruct依然能在多个评测上取得显著的优势,尤其是代码及中文理解上
Qwen2 模型的规格包括参数、GQA 和上下文长度

本次在本地安装部署的是qwen2-7b-instruct版本

Qwen2系列模型家族发布了系列GGUF格式模型。通过llama.cpp/Ollama等生态的发展,很多大语言模型都支持GGUF格式,极大地简化了大语言模型的应用流程,让即便是模型领域的初学者,只有一台CPU笔记本,也能轻松上手顶尖的AI技术。

硬件条件非常有限,但是也能够进行安装部署和运行,非常惊喜!
本次使用的是macbook air 笔记本,操作系统:windows10 专业版;CPU: i5-5250U
内存:8G 没有独立显卡。

可以成功安装,但是运行速度很慢,一个问题,(使用终端命令行)AI回答要1分钟,(使用ollama网页版)AI回答要4分钟。CUP和内存的占用都非常高。以下是实测的页面截图。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
下面我们一步步来展开跟大家介绍安装步骤,以及在本次安装中遇到的问题和解决办法。

一、qwen2-7b下载

GGUF通常可以通过单模型文件完成推理,魔搭社区可以通过命令行CLI,Python SDK,页面下载等多个方式下载单个模型。
https://modelscope.cn/models/qwen/qwen2-7b-instruct-gguf/files
qwen2-7b-instruct-gguf 下载地址
在这里插入图片描述

二、安装Python依赖包

本次电脑已经安装了anaconda和python3.12.4
需要安装(采用清华国内的镜像,速度会快很多)

pip install llama-cpp-python -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install openai
pip install uvicorn
pip install starlette
pip install fastapi
pip install sse_starlette
pip install starlette_context
pip install pydantic_settings

在构建RAG-LLM系统时,用到了llama_cpp这个python包。但是一直安装不上,报错。
“ERROR: Failed building wheel for llama_cpp_python”
“ERROR: Could not build wheels for llama_cpp_python, which is required to install pyproject.toml-based projects”
解决方法如下:安装visual studio 2022,并且勾选C++桌面开发选项与应用程序开发选项,必须要安装SDK
官网下载地址:https://visualstudio.microsoft.com/zh-hans/vs/
在这里插入图片描述

在这里插入图片描述

三、启动Qwen2-7B-Instruct大模型

CMD打开一个终端窗口,切换到GGUF模型文件目录,然后执行下面的指令,启动Qwen2-7B大模型

python -m llama_cpp.server --model ./qwen2-7b-instruct-q5_k_m.gguf \

成功完成后,不要关闭窗口

编写一个python client.py文件(本次采用的是PYcharm工具),代码如下,然后执行该代码,就可以用命令行和Qwen2-7B-Instruct大模型进行对话,Qwen2和openai调用的接口可以通用

from openai import OpenAI# 注意服务端端口,因为是本地,所以不需要api_key
client = OpenAI(base_url="http://127.0.0.1:8000/v1",api_key="not-needed")# 对话历史:设定系统角色是一个只能助理,同时提交“自我介绍”问题
history = [{"role": "system", "content": "你是一个智能助理,你的回答总是容易理解的、正确的、有用的和内容非常精简."},
]# 首次自我介绍完毕,接下来是等代码我们的提示
while True:completion = client.chat.completions.create(model="local-model",messages=history,temperature=0.7,stream=True,)new_message = {"role": "assistant", "content": ""}for chunk in completion:if chunk.choices[0].delta.content:print(chunk.choices[0].delta.content, end="", flush=True)new_message["content"] += chunk.choices[0].delta.contenthistory.append(new_message)print("\033[91;1m")user_input = input("> ")if user_input.lower() in ["bye", "quit", "exit"]:  # 我们输入bye/quit/exit等均退出客户端print("\033[0mBYE BYE!")breakhistory.append({"role": "user", "content": user_input})print("\033[92;1m")

在这里插入图片描述

四、安装Ollama,WebUI智能AI交互聊天

打造一个像chatgpt一样但专属于你自己的智能AI交互聊天
安装Node.js编程语言工具包 https://nodejs.org/zh-cn
在这里插入图片描述

安装完成之后,可以验证一下 Node.js 的版本,建议用目前的最新v20版本:

node -v

下载安装Ollama本地大模型管理工具
https://ollama.com/
在这里插入图片描述安装包下载之后的安装过程,和日常安装其他软件没有差别,包括点击Next以及Install等安装ollama到命令行。安装后续步骤中,我们可无需安装任何模型,因为我们在上文中我们已经安装了Qwen2-7B大模型,后面可以直接使用。

将qwen2-7b-instruct-q5_k_m.gguf 的模型拷贝到ollama指定目录下
以下以win10安装ollama情况下的操作为例,把模型拷贝到C:\Users\administer.ollama\models\qwen2-7b-instruct-q5_k_m.gguf类似目录下,确认自己电脑上的路径。
在.ollama\models\下创建一个qwen2-7b.mf 文件,名字可以自定义,能区分是哪个大模型就行,内容如下:

FROM C:\Users\administer\.ollama\models\qwen2-7b-instruct-q5_k_m.ggufTEMPLATE """{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>{{ end }}<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""
PARAMETER stop "<|im_start|>"
PARAMETER stop "<|im_end|>"

注意路径必须替换成自己的路径和文件名。
用Ollama加工你的本地大模型文件
在命令行终端中cd到C:\Users\administer.ollama\models(换成自己的路径)
然后运行ollama create qwen2-7b.mf(替换成自己的大模型文件名和.mf文件名)
同时在\models\blobs目录下面会多出一个转换后的大模型,原来的大模型可以删了或移走,如下图:
在这里插入图片描述
使用CMD 在指定目录下执行ollama list命令可以看到你的本地模型了
然后执行 ollama run qwen2-7b-instruct-q5_k_m 启动
C:\Users\Administrator.ollama\models>ollama run qwen2-7b-instruct-q5_k_m
在这里插入图片描述
启动完毕,其实我们已经有了一个和之前差不多的控制台对话界面,也可以与Qwen2-7B对话了

控制台聊天对话界面体验总归是不太好,接下来部署 Web 可视化聊天界面。
首先,下载ollama-webuiWeb 工程代码:git clone https://github.com/ollama-webui/ollama-webui-lite
然后切换ollama-webui代码的目录:cd ollama-webui-lite
在这里插入图片描述

设置 Node.js 工具包镜像源,以接下来下载 Node.js 的依赖包更加快速:
npm config set registry http://mirrors.cloud.tencent.com/npm/
安装 Node.js 依赖的工具包:npm install
最后,启动 Web 可视化界面:npm run dev
在这里插入图片描述
打开浏览器,输入 http://localhost:3000/ 就可以访问网站了
在这里插入图片描述
在这里插入图片描述

如果不能正常选择大模型
在ollama-webui-lite-main的目录外面,增加一个Modelfile.py文件
代码如下:

FROM ./qwen2-7b-instruct-q5_k_m.gguf

并将 qwen2-7b-instruct-q5_k_m.gguf 文件也copy到这个目录
在这里插入图片描述
最后执行Modelfile.py 文件

在这里插入图片描述

以上是亲测的安装过程,欢迎大家讨论!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/403200.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python 获取pdf文件中的超链接

pip install pymupdf pip install fitzimport fitz # PyMuPDFdef get_pdf_links(pdf_path):# 打开PDF文件document fitz.open(pdf_path)links []for page_num in range(len(document)):page document[page_num]# 获取当前页面的链接for link in page.get_links():links.app…

WPF自定义控件

控件模板 顾名思义就是在原有的控件上进行模版修改成自己需要的样式 把ProgressBar修改为一个水液面的进度条 <Window x:Class"XH.CustomLesson.MainWindow"xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http://s…

2024年第三届全国大学生数据分析实践赛A 题

↑ ↑ ↑ ↑ ↑​​​​​​​ ↑​​​​​​​ ↑​​​​​​​ ↑​​​​​​​ ↑​​​​​​​ ↑​​​​​​​ ↑​​​​​​​ ↑​​​​​​​ ↑​​​​​​​ ↑​​​​​​​ ↑ ↑ ↑​​​​​​​ ↑​​​​​​​ ↑​​​​​​​ ↑​​​​​​​ …

【Java学习】方法的引用

所属专栏&#xff1a;Java学习 &#x1f341;1. 方法引用 方法的引用&#xff1a;把已经存在的方法拿来使用&#xff0c;当作函数式接口中抽象方法的方法体 " :: "是方法引用符 方法引用时需要注意&#xff1a; 1. 需要有函数式接口 2. 被引用的方法必须存在 3. …

浅谈SIMD、向量化处理及其在StarRocks中的应用

前言 单指令流多数据流(SIMD)及其衍生出来的向量化处理技术已经有了相当的历史&#xff0c;并且也是高性能数据库、计算引擎、多媒体库等组件的标配利器。笔者在两年多前曾经做过一次有关该主题的内部Geek分享&#xff0c;但可能是由于这个topic离实际研发场景比较远&#xff0…

3:html(CSS):基础语法3

3.1网页布局与id 3.1.1网页布局 在这里将使用<div>分成一个一个的块&#xff0c;然后进行CSS的美化。这里要说一下html是一个前端的代码&#xff0c;但是它写出来的东西单调缺少美感&#xff0c;CSS就是进行美化的&#xff0c;这里我们使用类的概念来美化我们的网站。 …

X-Recon:一款针对Web安全的XSS安全扫描检测工具

关于X-Recon X-Recon是一款功能强大的Web安全扫描与检测工具&#xff0c;该工具能够帮助广大研究人员识别网页端输入数据&#xff0c;并执行XSS扫描任务。 功能介绍 1、子域名发现&#xff1a;检索目标网站的相关子域名并将其整合到白名单中。这些子域名可在抓取过程中使用&am…

Vue+ElementUI技巧分享:创建一个带有进度显示的文件下载和打包组件

在现代前端开发中&#xff0c;用户体验至关重要&#xff0c;尤其是在处理文件下载时。为用户提供实时的下载进度显示和打包功能&#xff0c;不仅能提升用户体验&#xff0c;还能使应用更具专业性。在本文中&#xff0c;我们将创建一个 Vue 组件&#xff0c;用于显示文件下载进度…

与人打交道的七个绝招

与人打交道的七个绝招&#xff0c;学会了让你混得风生水起&#xff01; 一、跟强者打交道&#xff0c;别绕圈子。就事论事&#xff0c;直奔主题&#xff1b; 二、跟没钱的人打交道&#xff0c;就直接告诉他能挣多少钱&#xff1b; 三、跟小人打交道&#xff0c;越虚假越好&…

URP平面阴影合批处理 shadow

闲谈 相信大家在日常工作中发现了一个问题 &#xff0c; urp下虽然可以做到3个Pass 去写我们想要的效果&#xff0c;但是&#xff0c;不能合批&#xff08;不能合批&#xff0c;那不是我们CPU要干冒烟~&#xff01;&#xff09; 好家伙&#xff0c;熊猫老师的偏方来了 &#x…

JavaScript基础(33)_鼠标滚轮滚动事件、键盘事件

鼠标滚轮滚动事件&#xff1a;onwheel 获取鼠标滚轮滚动的方向&#xff1a;wheelDelta 比如&#xff1a;向上滚动&#xff1a;109 &#xff08;所有正值都是向上&#xff09; 向下滚动&#xff1a;-109&#xff08;所有负值都是向下&#xff09; 注意&#xff1a;当…

基于华为atlas下的yolov5+BoT-SORT/ByteTrack煤矿箕斗状态识别大探索

写在前面&#xff1a; 本项目的代码原型基于yolov5yolov8。其中检测模型使用的yolov5&#xff0c;跟踪模型使用的yolov8。 这里说明以下&#xff0c;为什么不整体都选择yolov8呢&#xff0c;v8无疑是比v5优秀的&#xff0c;但是atlas这块经过不断尝试没有过去&#xff0c;所以…

AWS boto3 脚本访问 AWS 资源

AWS boto3 脚本访问 AWS 资源 引言boto3主要功能常见用例安装和基本使用 boto3.Client() 低级客户端基本用法关键参数 boto3.resource() 高级客户端常见参数用法 boto3.resource VS boto3.client相似点不同点总结 关于身份验证凭证隐式身份凭证显式身份验证凭证assuem role如何…

出海笔记精华问答 | 第四期

更新出海问答第四期&#xff0c;希望可以继续帮助大家解决问题哈。 Q1:当stripe把资金全退给客户但是货又发了&#xff0c;这是什么情况&#xff1f; A1: 这种情况一般是stripe不跟你合作了或者发生了争议。 Q2:如何知道stripe回复你的邮件是人工回复还是机器人回复&#xff…

Linux基础入门---安装vmware

&#x1f600;前言 本篇博文是关于Linux基础入门和vmwarel5.5下载&#xff0c;希望你能够喜欢。 &#x1f3e0;个人主页&#xff1a;晨犀主页 &#x1f9d1;个人简介&#xff1a;大家好&#xff0c;我是晨犀&#xff0c;希望我的文章可以帮助到大家&#xff0c;您的满意是我的动…

Merkle树(Merkle Tree):高效地验证某个数据块是否包含在数据集中

目录 Merkle树(Merkle Tree) 一、基本结构 二、构建过程 三、主要作用 四、应用领域 Merkle树(Merkle Tree) Merkle树(Merkle Tree),也被称为默克尔树或Merkle哈希树,是一种基于哈希的数据结构,主要用于验证大规模数据集的完整性和一致性。它的名字来源于其发明…

大数据技术——实战项目:广告数仓(第七部分)数仓工作流调度实操

目录 第12章 广告数仓全流程调度 12.2 新数据生成 12.2.1 广告监测日志 12.2.2 广告管理平台数据 12.3 工作流调度实操 12.3.1 DolphinScheduler集群模式 12.3.2 DolphinScheduler单机模式 第12章 广告数仓全流程调度 12.1 调度工具Dolphinscheduler DolphinScheduler…

VirtualBox上的Oracle Linux虚拟机安装Docker全流程

1.安装docker依赖 yum install -y yum-utils device-mapper-persistent-data lvm2 2.安装docker仓库 yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo 生成docker的yum源配置到在 /etc/yum.repos.d/docker-ce.repo 3.安装D…

Linux内核分析(调度类和调度实体)

文章目录 前言一、调度类1. stop_sched_class2. dl_sched_class3. rt_sched_class4. fair_sched_class5. idle_sched_class总结 二、调度类中的操作函数三、调度实体 前言 调度是操作系统内核的一个关键职责&#xff0c;它涉及到如何合理分配CPU时间给不同的进程或线程。在Lin…

uniapp打包H5的时候 清楚缓存(不安装依赖的前提下)

问题 在写项目的时候&#xff0c;打包好一个H5 发布成功&#xff0c;后来又重新打包新的包进行更新迭代&#xff0c;但是用户手机上还是上一个版本&#xff0c;本地缓存还是没有清除。 解决问题 步骤一&#xff1a;html不缓存 在html中&#xff0c;解决缓存的方法主要是依赖…