AIGC - Qwen大模型：Qwen-7B模型推理部署

AIGC - Qwen大模型：Qwen-7B模型推理部署

news/2025/1/6 19:38:35/文章来源:https://blog.csdn.net/qq_37755518/article/details/134149035

硬件环境

作为AIGC方面的小白来说，我抱着非常天真的想法，想让它在我的工作笔记本上用i5的CPU去跑，至于为什么这么想，当然是因为我没有GPU，身边也没有其他的带显卡电脑

恰好，在腾讯云看到了GN7的显示优惠活动，60块钱15天，Nvidia T4的AI卡，直接斥巨资购买了15天；不过这段时间准备搭一台自己用的服务器，初步计划是可以插4块GPU，内存上到200G，还是用DeepSpeed做下全量训练啥的。

软件环境

腾讯云的服务器，我选择了自己常用ubuntu镜像，同时此模型都是基于python语言，pytorch框架训练的模型，为了便于管理python版本库，使用anaconda来管理。

具体软件环境版本如下：

conda 4.8.2

python 3.9

pytorch2.0.1

cuda 11.7

具体的软件环境搭建过程，另起一篇去记录

模型部署使用

安装依赖环境

克隆github库：git clone https://github.com/QwenLM/Qwen.git

pip install -r requirements.txt

安装时，与其他模型要求的transformers库版本冲突,由于选择的conda环境不对，切换到之前创建的langchain环境 conda acitivate langchain

设置模型文件路径

此环境最大GPU显存为16GB，但跑7B模型的FP16需要20几个G，所以这里跑量化后的模型INT4版本的

运行cli_demo.py

python cli_demo.py

此DEMO还融合了使用GPT回答相关问题，所以需要安装GPT相应依赖库

pip install optimum auto-gptq

通过此方式从huggingface下载的模型文件会以缓存的形式存放在如下目录

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/176041.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

内存DMA及设备内存控制详解

内存DMA及设备内存控制详解

序言对于PCIe 设备（PCIe Endpoint）来说，其和CPU CORE、DRAM 的交互，主要涉及两种类型的内存访问： 设备内存访问：PCIe 设备的 Device Memory（设备内存）的访问，例如CPU …

阅读更多...

③ 软件工程CMM、CMMI模型【软考中级-软件设计师考点】

③ 软件工程CMM、CMMI模型【软考中级-软件设计师考点】

个人简介：Java领域新星创作者；阿里云技术博主、星级博主、专家博主；正在Java学习的路上摸爬滚打，记录学习的过程~ 个人主页：.29.的博客学习社区：进去逛一逛~ ③ 软件工程CMM、CMMI模型【软考中级-软件设计…

阅读更多...

flink 反压原理

flink 反压原理

背景在flink中由于数据倾斜或者数据处理速率的不匹配，很容易引起反压，本文就看一下flink反压的原理 flink反压原理 flink全流程pineline的反压实现其实依赖于TaskManager之间的反压和TaskManager内部的反压来实现 1.TaskManager之间的反压 2.Task…

阅读更多...

视频下载软件 Downie4 mac中文介绍

视频下载软件 Downie4 mac中文介绍

Downie mac是一款Mac平台上非常实用的视频下载工具。它支持下载各种视频网站上的视频，并且具有快速、稳定、易于使用的特点。 Downie支持下载各种视频网站上的视频，包括YouTube、Vimeo、Netflix、Hulu、Amazon等等。它具有快速、稳定的下载速度&#xff…

阅读更多...

Python---判定表法（功能测试）

Python---判定表法（功能测试）

能对多条件依赖关系进行设计测试点---判定表法等价类、边界值分析法主要关注单个输入类条件的测试定义:是一种以表格形式表达多条件逻辑判断的工具。条件桩: 列出问题中的所有条件，列出条件的次序无关紧要动作桩: 列出问题中可能采取的操作，操作的…

阅读更多...

python基于VGG19实现图像风格迁移

python基于VGG19实现图像风格迁移

目录 1、原理 2、代码实现 1、原理图像风格迁移是一种将一张图片的内容与另一张图片的风格进行合成的技术。风格（style）是指图像中不同空间尺度的纹理、颜色和视觉图案，内容（content）是指图像的高级宏观结构。实…

阅读更多...

mac 安装homebrew ,golang

mac 安装homebrew ,golang

mac 安装homebrew ,golang 安装homebrew安装golang选择 apple arm 版本安装配置环境变量安装homebrew /bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"回车执行指令后，根据提示操作。具体包括以下提示操作&am…

阅读更多...

每日一练 | 网络工程师软考真题Day46

每日一练 | 网络工程师软考真题Day46

阅读以下说明，答复以下【问题1】至【问题6】【说明】某公司总部效劳器1的操作系统为Windows Server 2003，需安装虚拟专用网〔VPN〕效劳，通过Internet与子公司实现平安通信，其网络拓扑结构和相关参数如图2-1所示。【问题1】在Wi…

阅读更多...

sql-50练习题16-20

sql-50练习题16-20

sql-50练习题16-20 前言数据库表结构介绍学生表课程表成绩表教师表 1-6 检索"01"课程分数小于60，按分数降序排列的学生信息1-7 按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩1-8 查询各科成绩最高分、最低分和平均分：以如下形式…

阅读更多...

c++-set和map

c++-set和map

文章目录前言一、set容器1、set容器介绍2、set的使用2.1 set的构造函数和迭代器2.2 set的容量2.3 set修改操作 3、multiset容器3.1 multiset容器介绍3.2 multiset容器使用二、map容器1、map容器介绍2、map容器使用2.1 map的构造函数与迭代器2.2 map中元素的修改2.3 map的容量…

阅读更多...

Java修仙传之Flink篇

Java修仙传之Flink篇

大道三千:最近我修Flink 目前个人理解： 处理有界，无界流的工具 FLINK： FLINK定义： Flink特点 Flink分层API 流的定义有界数据流（批处理）： 有界流：数据结束了，程序也…

阅读更多...

正则表达式包含数字和字符匹配

正则表达式包含数字和字符匹配

至少6位。 pattern : (?.[0-9])(?.[A-Za-z])[0-9A-Za-z]{6,} 正则表达式中的“?”是一个正向预查字符，它的意思是匹配前一个字符出现的最少一次。具体来说，当一个匹配出现时，它会检查前一个字符是否符合要求，如果符合&#xf…

阅读更多...

【Java 进阶篇】深入理解 Java Response：从基础到高级

【Java 进阶篇】深入理解 Java Response：从基础到高级

HTTP响应（Response）是Web开发中的一个关键概念，它是服务器向客户端（通常是浏览器）返回数据的方式。理解如何在Java中处理和构建HTTP响应是开发Web应用程序的重要一部分。本文将从基础知识到高级技巧，详细介…

阅读更多...

ardupilot开发 --- 深度相机篇

ardupilot开发 --- 深度相机篇

1. ZED 相机 1.1 规格 2. RealSense 需要机载计算机作为中介！！

阅读更多...

分布式锁-Redis红锁解决方案

分布式锁-Redis红锁解决方案

一分布式锁的概念 1：概念分布式锁（多服务共享锁） 在分布式的部署环境下，通过锁机制来让多客户端互斥的对共享资源进行访问控制分布式系统不同进程共同访问共享资源的一种锁的实现。如果不同的系统或同一个系统的不同主机之间共…

阅读更多...

使用 Authing 快速实现一套类似 OpenAI 的认证、API Key 商业权益授权机制

使用 Authing 快速实现一套类似 OpenAI 的认证、API Key 商业权益授权机制

如果你有经常使用 OpenAI 或者 HuggingFace 这一类面向开发者的 SaaS 服务，对于 API Key 肯定不会陌生。我们在使用这些服务时，通常都会在其平台上面创建一套 API Key，之后我们才能在代码中通过这一串 API key 访问其服务；同时&am…

阅读更多...

处理SAP资产折旧AFAB 过账报错：“科目 8019010100 要求一个成本会计分配”

处理SAP资产折旧AFAB 过账报错：“科目 8019010100 要求一个成本会计分配”

会计在进行资产折旧AFAB时报错如下所示： 原因分析： 折旧时没有把资产设置得成本中心带到过账凭证的成本中心字段中去。而资产中已经维护了成本中心了。所以要在资产过账的科目分配中设置一下路径如下： 或者TCODE：ACSET科目设置这…

阅读更多...

Jmeter(二十一)：jmeter导入和导出接口的处理（超详细）

Jmeter(二十一)：jmeter导入和导出接口的处理（超详细）

JMeter测试导入接口利用Jmeter测试上传文件，首先可根据接口文档或者fiddler抓包分析文件上传的接口；如下图： 以下是我通过fiddler所截取的文件上传的接口 1、填写导入接口的信息查看文件上传栏下的填写信息： 文件名称&#x…

阅读更多...

RT-Thread 7. RT-Thread Studio ENV修改MCU型号

RT-Thread 7. RT-Thread Studio ENV修改MCU型号

1. 修改MCU型号 2.在ENV界面输入 scons -c scons --dist3. dist下为更新后完整源代码 4.导入RT-Thread Studio 发现GD32F330已经生效了。 5. 自己编写startup_gd32f3x0.S，准确性待验证 ;/* ; * Copyright (c) 2006-2021, RT-Thread Development Team ; * ; * SPD…

阅读更多...

MySQL主从复制原理

MySQL主从复制原理

1、MySQL主从复制的三个步骤及其原理图 slave会从master读取binlog来进行数据同步 MySQL复制过程分成三步： 1、master将改变记录到二进制日志（binary log）。这些记录过程叫做二进制日志事件，binary log events。 2、slave将ma…

阅读更多...

最新文章

推荐文章