ChatGLM-6B (介绍相关概念、基础环境搭建及部署)

文章目录

  • 前言
  • 一、ChatGLM-6B是什么?
  • 二、安装虚拟的python环境
    • 1.下载
    • 2.安装
    • 3.设置国内源(危险)
    • 4.虚拟环境使用简介
  • 三、部署ChatGLM-6B
    • 1. clone代码
    • 2. 运行
      • 1.创建虚拟环境
      • 2.装包
        • 2.1 找到合适的pytorch版本
        • 2.1 安装依赖
        • 2.2 验证pytorch是否为GPU版本
      • 3.运行
  • 四、部署过程中遇到的问题
    • 1. 问题1
    • 2.问题2
    • 3.问题3
    • 4.问题4
  • 总结
  • 参考文章


前言

最近chatgpt比较火,正好看到国内有个类似开源的框架,那不得试试、
在这里插入图片描述


一、ChatGLM-6B是什么?

ChatGLM-6B是清华大学知识工程和数据挖掘小组(Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University)发布的一个开源的对话机器人。根据官方介绍,这是一个千亿参数规模的中英文语言模型。并且对中文做了优化。本次开源的版本是其60亿参数的小规模版本,约60亿参数,本地部署仅需要6GB显存。


二、安装虚拟的python环境

ChatGLM-6B 代码中有一些python3.7支持的语法,所以要有python3.7+ 的环境。我们使用conda来管理python环境
conda分为anaconda和miniconda。anaconda是包含一些常用包的版本,miniconda则是精简版.本文中我们将使用anaconda

1.下载

可以在官网中找到自己需要的版本进行下载,如果你系统也是ubutu 64位的,也可以使用我下载的版本进行安装

2.安装

在上一步下载的安装包同级,使用命令行执行以下命令

# 此处需写实际下载名称
bash Anaconda3-2023.03-Linux-x86_64.sh

在这里插入图片描述
然后根据提示操作即可
在这里插入图片描述
在这里插入图片描述

3.设置国内源(危险)

可以参考此文章。当然,如果不换源可以顺利装所有的包的话,尽量不要执行此操作。我就因为换了源,导致后边出了很多小问题。

4.虚拟环境使用简介

# 创建虚拟环境
conda create -n xxx python=3.8
# 进入虚拟环境
conda activate xxx
# 退出当前虚拟环境
conda deactivate
# 查看本地虚拟环境
conda info --env
# 删除虚拟环境
conda remove -n xxx --all

三、部署ChatGLM-6B

1. clone代码

git clone https://github.com/THUDM/ChatGLM-6B.git

2. 运行

1.创建虚拟环境

# 新建chatglm环境
conda create -n chatglm python=3.8
# 激活chatglm环境
conda activate chatglm

2.装包

2.1 找到合适的pytorch版本

我们可以通过以下命令查看自己的cuda及cuda驱动版本

nvidia-smi

在这里插入图片描述
我们可以看到,cuda版本是11.5,驱动版本是493.44,然后我们去官网寻找合适的pytorch装包指令,官网链接如下:
https://pytorch.org/get-started/locally/
https://pytorch.org/get-started/previous-versions/
如果找不到对应版本的话,可以参考此链接,通过驱动找到合适的cuda toolkit版本,然后再去官网寻找合适的装包指令
注:驱动是向下兼容的,其决定了可安装的CUDA Toolkit的最高版本。

2.1 安装依赖

# 根据上一步找到的安装指令进行安装:
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
# 安装gradio用于启动图形化web界面
pip install gradio
# 安装运行依赖
pip install -r requirement.txt

2.2 验证pytorch是否为GPU版本

import torch
torch.cuda.is_available()  ## 输出应该是True

3.运行

在运行前,我们需要修改一些文件内容

# web_demo.py
# 1. 新增mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models,下载模型使用清华源
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models')
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models').half().cuda()
# 2. 增加server_name和server_port参数
demo.queue().launch(share=True,server_name="0.0.0.0",server_port=9234)

四、部署过程中遇到的问题

1. 问题1

报错如下:

ERROR: Could not find a version that satisfies the requirement protobuf<3.20.1,>=3.19.5 (from versions: none)
ERROR: No matching distribution found for protobuf<3.20.1,>=3.19.5

在这里插入图片描述
原因及解决方案:
是因为上一步换了国内的镜像源,所以只需要指定装包路径即可l sls

pip install -r requirements.txt -i https://pypi.Python.org/simple/

2.问题2

报错如下:

ImportError: Using SOCKS proxy, but the 'socksio' package is not installed. Make sure to install httpx using `pip install httpx[socks]`.

在这里插入图片描述
原因及解决方案:
是因为我在命令行设置了“科学上网”,关掉即可

# 因为我设置的是临时的,所以在命令行输入如下代码即可
unset http_proxy
unset https_proxy

3.问题3

报错如下:

RuntimeError: CUDA out of memory. Tried to allocate 128.00 MiB (GPU 0; 7.93 GiB total capacity; 7.40 GiB already allocated; 53.19 MiB free; 7.40 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.  See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

原因及解决方案:
默认情况下,模型以 FP16 精度加载,运行上述代码需要大概 13GB 显存。如果你的 GPU 显存有限,可以尝试以量化方式加载模型,使用方法如下:

# int4精度加载,需要6G显存
# web_demo.py
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(4).cuda()

4.问题4

报错如下:

RuntimeError: Library cudart is not initialized

在这里插入图片描述

原因及解决方案:
我是用conda管理的环境,此时应该是cudatoolkit有问题,参考此issue

# 使用conda安装cudatoolkit
conda install cudatoolkit=11.3 -c nvidia

总结

例如:整个部署其实最难的应该还是环境了,虽然项目的README写的比较简单,但是真实搭建起来确实各种问题,希望此文章能给大家一些帮助吧。

参考文章

清华大学开源中文版ChatGPT模型——ChatGLM-6B发布
PyTorch、CUDA Toolkit 及显卡驱动版本对应关系
验证pytorch是否为GPU版本

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33951.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

小红书最新的内容趋势是什么?

为帮助大家更好地洞察小红书平台的内容创作趋势及品牌营销策略&#xff0c;新红推出10月月度榜单&#xff0c;从内容种草、品牌投放等方面入手&#xff0c;解析月榜数据&#xff0c;为从业者提供参考。 01 博主空降TOP榜 选题引发观众情感共鸣 据10月『创作人气榜』TOP30数据…

新手运营干货整理丨小红书达人合作平台盘点!

导语&#xff1a;每隔一段时间都会有新品牌入驻小红书&#xff0c;开启内容种草营销。对于新入门的运营和品牌方&#xff0c;小红书怎么找达人推广&#xff1f;去哪里找小红书达人合作平台&#xff1f;达人报价是否合理&#xff1f;小红书数据分析在哪里看&#xff1f;别慌&…

小红书变现方式分别有哪些?分享5种变现方式,让你轻松赚米

小红书是一个主打种草的平台&#xff0c;百分之八十以上的用户都是特别优质有消费力的一二线独立女性&#xff0c;不需要任何后期的成本投入&#xff0c;只要你的产品好&#xff0c;内容好&#xff0c;就能轻松带来收入。那么小红书变现方式有哪些呢&#xff1f;分享5种常见变现…

论文降重首选

用到的工具就俩个&#xff0c;chatGPT和deepl翻译配合使用。当然你需要魔法和chatGPT的账号。 chatGTP网址 deepl翻译网址 花了半月自己动手一点一点水的论文查重29&#xff0c;简直无语&#x1f611;&#xff0c;最后利用chatGTP改了2天。根据下载的查重报告看标红的内容。(…

成为一名优秀的程序员

引子    最近最火的莫过于ChatGPT了&#xff0c;在自己体验后就想着如何其他同事也能方便的起起来&#xff0c;毕竟独乐乐不如众乐乐&#xff0c;自己注册又是V-P-N&#xff0c;又是国外手机验证&#xff0c;对于大部分同事来说门槛还是高的。现在也有不少小程序&#xff0c…

【Hologres】实时数仓

Hologres揭秘:深度解析高效率分布式查询引擎-阿里云开发者社区 介绍 xxx实时数仓发展背景介绍 xxx实时数仓1.0从2019年开始搭建&#xff0c;基于Kudu OLAP引擎构建&#xff0c;前期承载业务不多&#xff0c;任务量不大&#xff0c;运行稳定、性能也很高&#xff0c;比较适合前…

GPT接入企微应用 - 让工作快乐起来

引子    最近最火的莫过于ChatGPT了&#xff0c;在自己体验后就想着如何其他同事也能方便的起起来&#xff0c;毕竟独乐乐不如众乐乐&#xff0c;自己注册又是V-P-N&#xff0c;又是国外手机验证&#xff0c;对于大部分同事来说门槛还是高的。现在也有不少小程序&#xff0c…

WorkTool企微机器人接入智能问答

一、前言 最新版的企微机器人已经集成 Chat &#xff0c;无需开发可快速搭建智能对话机器人。 从官方介绍看目前集成版本使用模型为 3.5-turbo。 二、入门 创建 WorkTool 机器人 你可以通过这篇快速入门教程&#xff0c;来快速配置一个自己的企微机器人。 实现的流程如图&…

python写彩票预测软件_python写彩票预测软件

日志介绍 克里普斯在平昌冬奥会上曾在双人项目上取Ι得了与弗里德里希并列第一的佳绩。 二人同在一个运动品牌旗下&#xff0c;因为恩比德即将推出个人专属战靴&#xff0c;所以库里选择了用这样的方式为同事庆祝。 不过湖人整体↟明显还没找回状态&#xff0c;而今天开场他们被…

告别PPT手残党!这6款AI神器,让你秒变PPT王者!

如果你是一个PPT手残党&#xff0c;每每制作PPT总是让你焦头烂额&#xff0c;那么你一定需要这篇幽默拉风的推广文案&#xff01; 我向你保证&#xff0c;这篇文案将帮助你发现6款AI自动生成PPT的神器&#xff0c;让你告别PPT手残党的身份&#xff0c;成为一名PPT王者。 无论…

chatgpt赋能python:Python生成画布:让你的数据更加生动形象

Python生成画布&#xff1a;让你的数据更加生动形象 如果你是一名数据分析师或者数据科学家&#xff0c;想要把你的数据展示得更加生动形象&#xff0c;那么Python生成画布可能是一款你应该了解的工具。 什么是Python生成画布&#xff1f; Python生成画布是指使用Python语言…

chatgpt智能提效职场办公-ppt怎么压缩文件大小

作者&#xff1a;虚坏叔叔 博客&#xff1a;https://xuhss.com 早餐店不会开到晚上&#xff0c;想吃的人早就来了&#xff01;&#x1f604; 压缩PPT文件大小有以下几种方法&#xff1a; 压缩图片大小&#xff1a;在PPT当中&#xff0c;图片是占用存储空间最大的部分&#xff0…

chatgpt赋能python:Python生成图片大小的重要性

Python生成图片大小的重要性 在现代互联网时代&#xff0c;SEO&#xff08;Search Engine Optimization&#xff09;已经成为了网站推广和排名的必要手段。然而&#xff0c;人们往往忽略了一些微小却影响深远的细节&#xff0c;比如说图片的大小。在这篇文章中&#xff0c;我们…

chatgpt智能提效职场办公-ppt怎么加音乐背景

作者&#xff1a;虚坏叔叔 博客&#xff1a;https://xuhss.com 早餐店不会开到晚上&#xff0c;想吃的人早就来了&#xff01;&#x1f604; 在 PowerPoint 中&#xff0c;您可以轻松地将音乐作为背景音乐添加到您的演示文稿中。下面是步骤&#xff1a; 打开您的 PowerPoint 演…

chatgpt赋能python:Python模拟操作软件:提升效率的神器

Python模拟操作软件&#xff1a;提升效率的神器 在当今数字化时代&#xff0c;能否高效地完成多任务操作和业务流程已成为企业或个人竞争力的体现。而Python模拟操作软件&#xff0c;则是让您轻松实现操作自动化、流程优化的神器。在本篇文章中&#xff0c;我们将全面介绍Pyth…

chatgpt赋能Python-python_btn

Python按钮&#xff08;Btn&#xff09;——让你的网站亮起来 作为一名有10年python编程经验的工程师&#xff0c;我一直致力于开发实用的工具和组件&#xff0c;以便于我们的客户更好的管理和优化他们的网站。在这篇文章中&#xff0c;我想向大家介绍一个很棒的python按钮&am…

chatgpt赋能Python-python_grbl

Python GRBL&#xff1a;一种先进的控制机器人的方式 Python GRBL是一种基于Python语言的机器人控制系统&#xff0c;它通过GRBL固件实现机器人的控制。这个系统是用来控制焊接、切割、雕刻和打印机等&#xff0c;可以接收G代码&#xff08;一种计算机指令代码&#xff09;来控…

我如何将 ChatGPT 放入编辑器中

随着所有炒作的进行&#xff0c;人工智能&#xff08;或者更确切地说是机器学习&#xff08;ML&#xff09;和大型语言模型&#xff08;LLM&#xff09;&#xff09;无处不在。就个人而言&#xff0c;我可能不会经常使用 ChatGPT&#xff08;和类似的替代品&#xff09;&#x…

手把手教你实现折线图之------安卓最好用的图表库hellocharts之最详细的使用介绍

因为项目需要搞一个折线图&#xff0c;按照日期显示相应的成绩&#xff0c;所以有了本文。 以前用过一次XCL-chart&#xff0c;但是感觉只适合固定图表&#xff0c;不去滑动的那种&#xff0c;因为你一滑动太卡了你懂得&#xff08;毕竟作者好久没更新优化了&#xff09;&#…

一文学会炫酷图表利器pyecharts,领导能不重用你?

前言 前段时间&#xff0c;领导突然把我叫到办公室… 公司高层要看看上半年度项目组业绩数据分析&#xff0c;准备下吧&#xff01;可以嘛&#xff1f; 没办法&#xff0c;硬着头皮也要上&#xff01;一口答应&#xff0c;保证完成任务&#xff01; 说到数据分析&#xff0…