chatglm+tesla m40低成本部署

chatglm+tesla m40部署

  • tesla m40安装
    • BIOS设置
    • 驱动下载并安装
    • 验证安装并切换WDDM模式
  • chatglm安装
    • 环境安装
    • 加载模型
    • CUDA安装
    • Torch安装
    • 源码修改
  • 成功结果展示
  • 常见问题

本机配置 i5 13600k ,主板是微星760 bomer

tesla m40安装

Tesla M40 24G实际上是计算卡,不是显卡,所以必须有核显或亮机卡
注意安装M40等大于4G显存显卡前,一定要去BIOS里打开大于4G选项,不然无法正确识别显卡。
(微星760 bomer 在BIOS里setting里)

BIOS设置

我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:

  1. Above 4G memory/Crypto Currency mining 功能开启
    需要在BIOS中将这一项开启,目的是获得对4G以上显存卡的支持。
    Above 4G memory/Crypto Currency mining [允许]
  2. BIOS UEFI 模式开启
    使用该显卡需要开启主板BIOS的UEFI模式
    BIOS UEFI/CSM Mode [UEFI]

驱动下载并安装

安装前检查是否"设备管理器"中是否己经识别出tesla m40 ,如下图
在这里插入图片描述
https://www.nvidia.cn/Download/index.aspx?lang=cn
在这里插入图片描述在这里插入图片描述选择最新的驱动程序下载并安装。

验证安装并切换WDDM模式

验证安装
“CMD命令提示符”工具中,输入nvidia-smi,查看现有显卡信息,如图所示
在这里插入图片描述
切换WDDM模式
使用“以管理员身份运行”的模式打开“CMD命令提示符”工具,输入 nvidia-smi -dm 0
在这里插入图片描述

chatglm安装

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上.

环境安装

1、下载本仓库:
git clone https://github.com/THUDM/ChatGLM2-6B
cd ChatGLM2-6B
2、pip 安装依赖:
pip install -r requirements.txt

加载模型

1、安装Git LFS
https://docs.github.com/zh/repositories/working-with-files/managing-large-files/installing-git-large-file-storage
在这里插入图片描述

CUDA安装

查询显卡驱动程序版本
在这里插入图片描述
CUDA具体的版本,如下
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
在这里插入图片描述
Windows下安装CUDA,参考如下(一个是cuda安装,另一个是CuDNN安装
https://blog.csdn.net/weixin_34409703/article/details/93226830

Torch安装

如果出现 torch的安装报错,可能与操作系统及 CUDA 的版本相关。直接上pytorch 的官网
https://pytorch.org/get-started/locally/
注意,tesla m40驱动可以安装最新版本,而CUDA只选11.8(CUDA 12版本以上会报错)
在这里插入图片描述
复制并执行以下指令
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

源码修改

在这里插入图片描述
在E:\open_code\ChatGLM2-6B\chatglm2-6b-project\web_demo.py
tokenizer = AutoTokenizer.from_pretrained(“THUDM/chatglm2-6b”, trust_remote_code=True)
model = AutoModel.from_pretrained(“THUDM/chatglm2-6b”, trust_remote_code=True).cuda()
修改为如下相对地址:
toenizer = AutoTokenizer.from_pretrained(“…\…\chatglm2-6b-model\chatglm2-6b”, trust_remote_code=True)
model = AutoModel.from_pretrained(“…\…\chatglm2-6b-model\chatglm2-6b”, trust_remote_code=True).quantize(8).half().cuda()
或修改成绝对地址:
toenizer = AutoTokenizer.from_pretrained(“E:\open_code\ChatGLM2-6B\chatglm2-6b-model\chatglm2-6b”, trust_remote_code=True)
model = AutoModel.from_pretrained(“E:\open_code\ChatGLM2-6B\chatglm2-6b-model\chatglm2-6b”, trust_remote_code=True).quantize(8).half().cuda()

成功结果展示

python web_demo.py

在这里插入图片描述

常见问题

1、错误Torch not compiled with CUDA enabled解决
在这里插入图片描述
把以下代码运行一下
import torch
print(torch.version)

print(torch.cuda.is_available())
在这里插入图片描述
如果torch.cuda.is_available()返回False,那就是安装了torch cpu版本或显卡不是Nvidia英伟达的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/57083.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Win11 的这 19 个新功能,你都用上了吗?

Windows 11 是 Windows 的新版本,现在正在向受支持的 PC 推出多项新功能和改进。 Windows 11 于 10 月 5 日开始推出,微软也发布了 Windows 11 ISO 镜像。与之前的 Windows 10 更新不同,这个新的操作系统专注于面向消费者的功能和改进&#x…

使用WinINet和WinHTTP实现Http访问

Http访问有两种方式,GET和POST,就编程来说GET方式相对简单点,它不用向服务器提交数据,在这个例程中我使用POST方式,提交数据value1与value2,并从服务器得到他们的和(value1 value2)…

day02 创建第一个Windows窗口及Windows的消息处理

文章目录 第一个Windows窗口程序1. 入口函数2. 创建窗口类3. 注册窗口4. 创建窗口实例5. 处理消息事件6. 回调函数完整测试 Windows消息处理 第一个Windows窗口程序 1. 入口函数 Windows编程的入口函数: 建议直接F1查询官方文档,Ctrl CV int WINAPI W…

chatgpt赋能python:Python导入自己的文件:完全指南

Python导入自己的文件:完全指南 Python是一种高级编程语言,许多工程师在开发过程中使用它。当我们在编写Python应用程序时,可能需要将代码拆分为多个模块,以使其更易于维护和扩展。在这种情况下,我们需要导入自己的Py…

chatgpt赋能python:Python中的库导入方法详解

Python中的库导入方法详解 Python拥有丰富的库,这也是它广受欢迎的原因之一。而在使用Python编程时,如何正确地导入库是至关重要的。本文将介绍Python中常用的库导入方法,并帮助读者理解每种方法的优缺点。 直接导入库 最基本的导入库方法…

Postman下载安装教程

看到很多小伙伴在问 Postman 下载的相关问题,花时间整理了下,下面教新入门的小伙伴如何去下载 Postman。 开始前我们可以先了解下:Postman 简介 下载 第一步:进入 Postman 官网 首先,我们需要进入 Postman 的官网。…

001 用python和tushare获取股票数据

数据获取可以用爬虫,api。api我了解的有tushare和pandas_datareader,用conda或者pip命令安装即可。此处只介绍tushare。 一、 注册 到tushare官网注册,并获取自己的token(调用api需要token才可以访问数据)。官网链接…

现在学Python还有前途吗?能做什么?

现在学Python还有前途吗?能做什么?无论是从行业人才需求,国家政策支持,还是从Python本身广泛应用的优势来看,学Python都是极其有个人发展前途的。至于可以从事的工作岗位就更多了,像Linux运维、Python Web网…

ChatGPT:2. 使用OpenAI创建自己的AI网站:1. 初探API

使用OpenAI创建自己的AI网站 如果你还是一个OpenAI的小白,有OpenAI的账号,但想调用OpenAI的API搞一些有意思的事,那么这一系列的教程将仔细的为你讲解如何使用OpenAI的API制作属于自己的AI网站。博主只能利用下班时间更新,进度慢…

推荐一个好用的开发工具百宝箱

随着科技不断发展,越来越多的工具在网络上应运而生,方便我们更加高效地完成各种任务。今天我要向大家介绍一款在线工具——码加在线工具 - 做更好的工具,它可以帮助你轻松完成许多繁琐、复杂的工作。 首先,码加在线工具 是一款非…

零代码编程:用ChatGPT打造一个信息推送的微信机器人

很多时候,我们希望监控一些最新信息,能够第一时间在微信上看到。现在有很多这方面的消息推送工具,比如wxpusher、Pushplus、server饭、server酱等: pushplus:免费账号一天限制200条请求数,1分钟内最多接收…

案例:百度的评论系统是怎么设计的?你想象不到

百度评论中台为百度系产品提供便利接入、持续稳定的评论能力,是百度社区氛围体系内最重要的基础能力之一,日均流量达到百亿规模,在业务不断发展过程中,百度评论中台实现了功能快速迭代、性能稳步提升,本文将从整体介绍…

CSDN - 屏蔽无耻的百度广告

由于CSDN在chrome上显示效果与编辑页面都很友好,所以访问csdn或者维护博客时常使用chrome。 可恶的百度广告总是在左下角和右下角弹出,深恶痛绝啊!! 春天的到来!!—Adblock Plus插件 【1】下载 Adblock P…

在家可以做什么副业,适合新手的四个网上兼职

近期一个月,好多地方因口罩影响,多多少少都要求他们在家隔离,除开每日待在家里,也只能是在社区里散散步。想起很多小伙伴由于疫情在家里不可以工作中,收益逐渐变少少,很有可能的身上也有抵押借款和车辆贷款…

副业赚钱的路子有哪些?分享6种较为实用的副业方式

如今社会的压力越来越大,很多人都开始积极寻找副业赚钱的途径,以缓解生活中的经济压力。副业赚钱的方式多种多样,可以依据个人的兴趣爱好、特长技能来选择。以下分享6种较为实用的副业赚钱方式。 1、跑腿服务 跑腿服务是目前非常受欢迎的副业…

下午有自由时间可以做的副业推荐

对于大部分人来说,工资收入并不足以实现快速攒钱的目标。而且现在社会发展很快,大部分工作都不能保证稳定,所以发展自己的副业很重要。下面小编给大家推荐5个所有人都能做的副业,感兴趣的朋友可以从中选择适合自己的副业坚持做下去…

上班时间适合搞什么副业?最适合普通人的副业:用你的职业技能、生活经验来做

首先我告诉你所谓副业是和主业一样,或者说需要你投入十二分精力去对待的,需要你放弃社交娱乐,本质上就是一套自虐之路,做不到的还是老老实实上班才是正道 其次,你在网上看到所谓的副业介绍都只是别人的“副业”&#…

python网络副业有哪些?以自身经历分享怎么做副业挣钱

网络副业我个人比较看好的是Python,至少我是真实体会到了Python做副业真香,疫情被关在家那段时间也没耽误赚钱,反而比平常赚的还多一点,下图是我疫情期间在家做Python副业收入的部分截图,那会儿我用Excel表格每天记了一…

IT行业可以做的副业

去年一年,新冠疫情的阴霾让大部分职场人都不好过。当加薪和年终奖都遥不可及,不少人开始思考经营一份副业的可能性。 那么有没有什么是适合IT技术人员发展的副业呢?接外单赚取外快?不,这一定不会是最好的选择&#xff…

程序员可以做哪些副业?

原文链接:https://dsx2016.com/?p508 程序员自身的属性决定了副业的天花板。 最理想的情况是副业在赚钱的同时可以对主业进行属性加成。 同时如果主业做得好也能对副业产生积极的作用。 有鉴于996和24小时随机加班是it常态 推荐睡后收入的方式,并且长…