AutoDL 云/本地部署百川2、GLM2

AutoDL 云上部署百川2、GLM2

AutoDL 云上部署百川2、GLM2
配置环境
体验
常见问题
huggingface访问不了，使用学术资源加速
大文件上传，百度、阿里网盘都可
CUDA 空间不足
系统盘空间不足
省钱绝招
软件源

本地部署百川2、GLM2
根据显存大小选模型
拉取docker镜像
cuda GPU 版本不匹配问题

AutoDL 云上部署百川2、GLM2

配置环境

autodl：https://www.autodl.com/login

在算力市场选择一个GPU：

我比较喜欢4090，因为这个算力和A100一样，在大模型推理上速度比A100快。（A100主要是信道好，更适合训练大模型）。

我们用云上已经配置好的大模型环境：

选择【社区镜像】，输入：THUDM/ChatGLM2-6B/ChatGLM2-6B

选择第一个：

就是这个环境：

底部的【立即创建】点不了，可以点【余额不足充值】，充值 3 块钱即可，先不要充很多，低成本测试。

选择 JupylerLab：
不用了，就回到这个界面，点击关机即可，不会扣费。

如果之前的GPU上有下载文件，可以克隆实例，开新GPU。

体验

在终端2，输入：source /etc/network_turbo

进入ChatGLM2-6B文件夹：cd ChatGLM2-6B

命令行运行大模型：python cli_demo.py

常见问题

huggingface访问不了，使用学术资源加速

如果在终端中使用：

source /etc/network_turbo

如果是在Notebook中使用：

import subprocess
import osresult = subprocess.run('bash -c "source /etc/network_turbo && env | grep proxy"', shell=True, capture_output=True, text=True)
output = result.stdout
for line in output.splitlines():if '=' in line:var, value = line.split('=', 1)os.environ[var] = value

取消学术加速，如果不再需要建议关闭学术加速，因为该加速可能对正常网络造成一定影响

unset http_proxy && unset https_proxy

大文件上传，百度、阿里网盘都可

https://www.autodl.com/docs/netdisk/

CUDA 空间不足

https://www.autodl.com/docs/qa4/

系统盘空间不足

https://www.autodl.com/docs/qa1/

省钱绝招

https://www.autodl.com/docs/save_money/

软件源

https://www.autodl.com/docs/source/

本地部署百川2、GLM2

huggingface镜像网站：https://aliendao.cn/models

baichuan2-13B-Chat-4bits 获取链接：https://xueshu.fun/3041/

注册后，找到签到得2个金币，刚好换这个。

根据显存大小选模型

比如GPU显存是 16G（nvidia-smi查看）。

百川2-13B 光是模型加载就需要26GB的显存，加上推理需要的消耗，没28GB以上的显存是搞不了。

百川2-13B支持8位和4位的量化。

8位量化之后需要18.6G以上的显存。

4位量化之后需要11.5GB以上的显存。

量化才能部署上。

拉取docker镜像

拉取autodl上的镜像：

docker pull registry.cn-beijing.aliyuncs.com/codewithgpu/thudm-chatglm2-6b:SPawIKFit4

根据当前镜像创建容器：

docker run -it --name baichuan registry.cn-beijing.aliyuncs.com/codewithgpu/thudm-chatglm2-6b:SPawIKFit4 /bin/bash

再使用复制命令，把大模型放进入，如：

sudo docker cp Baichuan2-13B-Chat-4bits baichuan:/mnt 
# 把 Baichuan2-13B-Chat-4bits 复制到 baichuan 容器 mnt 文件夹。

进入你刚创建的容器，如：

docker exec -it baichuan /bin/bash

创建一个虚拟环境，避免包冲突。

python3 -m venv myenv       # 创建虚拟环境
source myenv/bin/activate   # 激活虚拟环境

下载大模型的环境依赖：

pip install -r requirements.txt

cuda GPU 版本不匹配问题

请猛击：https://blog.csdn.net/AiTanXiing/article/details/129933911

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/178605.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！