全网最新版ChatGLM-6B开源模型环境详细部署及安装——如何在低显存单显卡上面安装私有ChatGPT GPT-4大语言模型

目录

  • 前言
    • 前期准备
      • 电脑要求
      • 安装anaconda
      • 安装相应版本的CUDA
      • 配置ChatGLM-6B Conda环境
      • 安装pytorch
  • ChatGLM-6B最新版模型环境部署及安装
    • 源码下载
    • 模型下载
    • 相关库安装
    • 运行web演示
    • 作为API部署
  • 参考资料
  • 其它资料下载

前言

ChatGPT的爆火让许多公司和个人都想要开发自己的大型语言模型,但是,由于算力和语言模型开发能力等诸多方面的限制,许多人最终都只能在开发的早期阶段止步不前。然而,近期清华大学知识工程和数据挖掘小组(Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University)发布了对话机器人ChatGLM-6B的开源版本,这一切都变得更加容易了。

这个中英文语言模型拥有千亿参数规模,并且对中文进行了优化。本次开源的版本是其60亿参数的小规模版本,仅需要6GB显存就可以在本地部署。这意味着,即使是在普通显卡的电脑上,也可以轻松部署一个类似于GPT的大型语言模型。这是一个令人振奋的时刻,让我们一起期待中国版ChatGPT更多的创新和突破!

在这里插入图片描述

量化等级最低 GPU 显存(推理)最低 GPU 显存(高效参数微调)
FP16(无量化)13 GB14 GB
INT88 GB9 GB
INT46 GB7 GB

前期准备

电脑要求

  • python版本要求:3.8
  • windows系统:Windows 7 or later (with C++ redistributable)
  • 显卡:6G以上GPU

安装anaconda

从anaconda官网,下载安装anaconda。具体教程详见官网教程。
在这里插入图片描述

安装相应版本的CUDA

首先在终端查看你的Nividian版本,命令如下:

nvidia-smi

在这里插入图片描述
查看到本机可装CUDA版本最高为12.0,版本向下兼容,意思就是CUDA 12.0及以下版本的都可以安装,但一般不建议使用最新版本的。因为可能后续其他安装包没有更新对应版本的可以下载。由于Pytorch(可以从pytorch官网)中可以看到,目前的CUDA版本一般是11.7和11.8,所以建议选择11.8版本以下的。博主这里选择了11.7进行安装。
在这里插入图片描述

安装完后,注意需要看下系统环境变量中地址有没有相应版本的cuda,比如我的电脑就是配置了下面几个环境变量
在这里插入图片描述
除上面两个之外 ,还可以加入以下环境变量,以保证不会出错。我没配置下面两个,也没出错,所以大家根据实际情况选择是否加入下面两个环境配置。

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7\extras\CUPTI\lib64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7\include

不配置可能会报错,Could not load dynamic library ‘cudart64_110.dll’; dlerror: cudart64_110.dll not found

配置ChatGLM-6B Conda环境

首先以管理员方式启动windows命令窗口,在搜索中输入cmd即可打开,输入以下命令,新建一个名字为ChatGLM的环境,并安装tensorflow-gpu版本。新建环境过程中选择y,进入下一步

conda create --name ChatGLM python==3.8.10

接下来激活ChatGLM的环境

conda activate ChatGLM

安装pytorch

如果电脑配置了GPU,要注意需安装GPU版本的pytorch,具体可登录官网链接:

这里要注意选择你是什么系统,cuda是安装了什么版本(博主前面选择的是11.7),然后复制下面红框中的命令到终端就可以安装了。

在这里插入图片描述
在终端运行下面命令,即可安装成功pytorch-GPU版本:

conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

在终端输入python,然后依次输入下面代码,验证torch-GPU版本是不是成功。

import torch
torch.cuda.is_available()  ## 输出应该是True

在这里插入图片描述

ChatGLM-6B最新版模型环境部署及安装

源码下载

登录github官方地址下载源码或者直接使用git命令clone:

git clone https://github.com/THUDM/ChatGLM-6B.git

接着在源码所在文件夹下,新建model文件夹

在这里插入图片描述

模型下载

从hugging face下载所有文件下来,放到model文件夹内。

其中模型文件(大于 1G 的)如果下载速度慢,可以在国内清华云源中单独下载这几个模型文件(其他这个源没有的文件还是需要在 huggingface 上下载):https://cloud.tsinghua.edu.cn/d/fb9f16d6dc8f482596c2/

最后model文件夹内应该如下显示:

在这里插入图片描述

相关库安装

在终端下打开ChatGLM-6B安装的目录,然后运行下面命令,安装相关库:

pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simp1e

在这里插入图片描述

运行web演示

在运行之前,需要先修改web_demo.py文件中的模型地址,具体为第5行与第6行,具体如下:
在这里插入图片描述

tokenizer = AutoTokenizer.from_pretrained("model", trust_remote_code=True)
model = AutoModel.from_pretrained("model", trust_remote_code=True).half().cuda()

温馨提示,根据实际显卡显存,可以更改第6行关于model运行方式:

# 6G 显存可以 4 bit 量化
model = AutoModel.from_pretrained("model", trust_remote_code=True).half().quantize(4).cuda()# 10G 显存可以 8 bit 量化
model = AutoModel.from_pretrained("model", trust_remote_code=True).half().quantize(8).cuda()# 14G 以上显存可以直接不量化,博主显存为16G选择的就是这个
model = AutoModel.from_pretrained("model", trust_remote_code=True).half().cuda()

在终端输入命令,注意不要用python3,因为可能会使用到其它环境下的python。

python web_demo.py

刚开始运行,需要等到1-2分钟加载本地模型:

在这里插入图片描述
接着在浏览器打开:http://127.0.0.1:7861,就可以开始体验ChatGLM-6B了。博主体验了下,生成速度还是很快。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

作为API部署

首先需要安装额外的依赖

pip install fastapi uvicorn

然后运行仓库中的 api.py:

python api.py

默认部署在本地的 8000 端口,通过 POST 方法进行调用

curl -X POST "http://127.0.0.1:8000" \-H 'Content-Type: application/json' \-d '{"prompt": "你好", "history": []}'

得到的返回值为

{"response":"你好👋!我是人工智能助手 ChatGLM-6B,很高兴见到你,欢迎问我任何问题。","history":[["你好","你好👋!我是人工智能助手 ChatGLM-6B,很高兴见到你,欢迎问我任何问题。"]],"status":200,"time":"2023-03-23 21:38:40"
}

参考资料

ChatGLM-6B 博客
ChatGLM-6B 官方github地址

其它资料下载

如果大家想继续了解人工智能相关学习路线和知识体系,欢迎大家翻阅我的另外一篇博客《重磅 | 完备的人工智能AI 学习——基础知识学习路线,所有资料免关注免套路直接网盘下载》
这篇博客参考了Github知名开源平台,AI技术平台以及相关领域专家:Datawhale,ApacheCN,AI有道和黄海广博士等约有近100G相关资料,希望能帮助到所有小伙伴们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9027.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

记录pip问题(解决下载慢的问题、升级失败问题)

目录 一、解决下载慢的问题 1、问题分析 2、解决办法 (1)下载时加入参数 -i [镜像源地址] 例如: (2)使用命令——设置源(推荐) (3)修改配置文件——设置源&#xf…

ChatGPT付费创作系统V2.0.2独立版 +WEB端+ H5端 + 小程序

GPT付费体验系统最新版系统是一款基于ThinkPHP框架开发的AI问答小程序,是基于国外很火的ChatGPT进行开发的Ai智能问答小程序。当前全民热议ChatGPT,流量超级大,引流不要太简单!一键下单即可拥有自己的GPT!无限多开、更…

文心ERNIE源码学习与实践:为超越ChatGPT打下技术基础!

ERNIE学习与实践:为超越ChatGPT打下技术基础! ERNIE是BERT相爱相杀的好基友,由ERNIE发展起来的文心大模型,是GPT3.0的强劲竞争对手,未来还会挑战ChatGPT的江湖地位! 在“BERT学习与实践:为紧追…

加速访问Cloudflare的网站的解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

数据库开发工具界的ChatGPT来了

提提需求,就能按照你的要求自动生成库表、构建测试数据、查询变更数据,动不动还要帮你优化 SQL …… 这样的数据库开发工具到底有多强大? NineData 通过内置强大的AI生成能力,让你可以在 NineData 平台上,通过自然语言…

不再焦虑了!小白的prompt入门实验指南Mixlab推荐

‍ ‍相信大家都体验过了文心一言、ChatGPT、Claude、Stable diffusion、MidJourney等等生成式人工智能(大模型LLMs),在使用过程中有些人用得很好,产生的结果效果非常好,而有些人可能一用就弃坑了。 造成人与人的使用体…

人工智能与营销新纪元 2023 AI+

人工智能是什么? 有望飞跃式提升营销生产力的变革力量 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的 技术科学。是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相…

神仙打架——号称是性能最强的中英文百亿参数量开源模型Baichuan-13B他来了!

下午开个会的功夫看到新闻推送一条最新的大模型相关的项目开源发布了,到底是怎么个事我们来一起看下。 官方项目地址在这里,如下所示: 可以看到:才刚刚过去十几分钟的时间就已经有超过500的star量了。 就在不久前的6月15日&…

ChatGPT 50+ 使用案例以及使用指令 Prompt

原文:ChatGPT 50 使用案例以及使用指令 Prompt - 哔哩哔哩 ChatGPT 是一个非常强大的人工智能工具,但如果你像大多数人一样使用它,那么你就错过了它的全部潜力。 在本文中,我整理了 Chat GPT 用例的最终列表,包括生产…

chatgpt赋能python:Python编写SEO文章的技巧

Python编写SEO文章的技巧 概述 随着互联网的普及,越来越多的网站和公司开始关注SEO,也就是搜索引擎优化,通过优化网站结构和内容,使其在搜索引擎中排名提高,从而吸引更多的流量。而Python作为一种高级编程语言&#…

chatgpt赋能python:Python如何写SEO优化文章

Python 如何写SEO优化文章 SEO(Search Engine Optimization)是指通过优化网站结构、代码和内容,提升网站在搜索引擎中的排名,从而增加网站的流量。编写SEO优化文章的目的就是为了能够更好地吸引搜索引擎的爬虫,提高文…

chatgpt赋能python:Python创建SEO文章的指南

#Python创建SEO文章的指南 在当今数字化世界中,SEO(搜索引擎优化)对于拥有一个成功的在线业务至关重要。SEO文章不仅可以帮助提高网站的排名,还可以吸引更多的访问者并提高转化率。在本文中,我们将介绍如何使用Python…

让最近爆火的ChatGPT来谈谈,作为一个技术人该如何写好一篇技术博文

ChatGPT 是由 OpenAI 训练的一个大型语言模型。专门设计用于回答用户提出的问题,我可以提供有价值的信息,并帮助用户解决问题 下面的回答均来自ChatGPT CharGPT 如何写好一篇技术博文?写技术博文需要具备那些能力就用java实现冒泡排序来写一…

chatgpt赋能python:用Python写SEO文章怎么做?

用Python写SEO文章怎么做? 作为一名有10年Python编程经验的工程师,我很清楚Python的强大和多用途性。如果你是一个优秀的SEO从业者,你可能已经了解了这一点。Python可以用来处理大量数据、网页分析、自动化流程、爬虫抓取以及机器学习。在这…

最简洁的Plato-mini闲聊机器人部署教程,举一反三部署类chatGPT

★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>> 百度PLATO-Mini闲聊模型 PLATO-MINI| 6-layers, 12-heads, 768-hidden|在十亿级别的中文对话数据上进行预训练。参数量更小,但效果更好。只支持闲聊型对话。 无需任何…

倒计时2天!顶级专家联合打造,“大模型前沿技术讲习班”周末开讲,提供多种全额奖学金...

大模型正在引发人工智能研究与应用范式产生重大变革,越来越多的顶级团队和杰出人才纷纷加入这一技术浪潮。作为AI大模型科研先锋,智源研究院聚集了来自高校院所和创新企业的一大批大模型领域卓越学者与工程师,共同致力于推动我国大模型的创新…

大型金融机构用户体验生态探索与实践

作者 | 中国工商银行软件开发中心 责编 | 夏萌 随着金融服务线上化和用户对优质体验的追求,构建科学的用户体验生态并持续推动产品用户体验升级成为传统金融机构的重要挑战。 从客户的角度来看,用户体验直接关系到他们在银行中获得服务的感受和满意度。简…

智头条|ChatGPT-4发布,澜舟科技完成数亿元融资

行业动态 李开复:AI2.0将催生三大投资机会 3月14日,北京创新工场总部举办“AI1.0到AI2.0的新机遇”趋势分享会。创新工场董事长兼CEO李开复博士指出,在深度学习的重大突破之后,AI已经来到从1.0迈入2.0的拐点,AI2.0将会…

博士申请 | 香港中文大学(深圳)李海洲教授招收NLP等方向全奖博士/博后/RA

合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 香港中文大学(深圳) 香港中文大学(深圳)是一…

ChatGPT引爆AIGC,垂类龙头迎来“创新春天”

文|智能相对论 作者|陈壹 一款AI产品,到底有多神? ChatGPT刷新了我们的认知。 它用2个月时间,完成TikTok花9个月,Instagram花2年半才做到的事,成为史上用户增速最快破亿的消费级应用程序。 它也凭借一己之力&#xff0…