Centos/Ubuntu离线部署清华chatGLM(特别详细,十分钟搞定)

引言

前段时间,清华公布了中英双语对话模型 ChatGLM-6B,具有60亿的参数,初具问答和对话功能。最!最!最重要的是它能够支持私有化部署,大部分实验室的服务器基本上都能跑起来。因为条件特殊,实验室网络不通,那么如何进行离线部署呢?经过一下午的折腾终于搞定了,总结了这么一个部署文档供大家讨论学习。除去下载模型以及依赖包的时间,部署十分钟搞定!!让我们冲~~

前提条件

CUDA Version 11.0,内存32G或者显卡内存8G+8G机器内存及以上。

安装Miniconda

1.1 获取安装包

方法一、把Miniconda安装包、ChatGLM-6B模型、webui项目、项目依赖包都放到网盘里面了,可以直接通过网盘获取(获取方式放在最后)。

方法二、因为Miniconda自带python,所以要在官网下载python版本为3.10的Miniconda版本。下载地址为:https://docs.conda.io/en/latest/miniconda.html#linux-installers,具体截图如下。(如果不想自己麻烦,我也已经把它放到云盘里面了)。

1.2 安装 Miniconda

将Miniconda下载安装包放到你要放的目录,这里我放在:/home/work/chatglm/miniconda 中,然后执行sh Miniconda3-latest-Linux-x86_64.sh 如下图所示,执行完之后按照提示进行回车(enter)就好了,注意:最后选择“yes”,这样每次启动,它都会自动给你切换到conda的base环境中。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1JNLIhtv-1680244896973)(C:\Users\Lenovo\AppData\Roaming\Typora\typora-user-images\image-20230331102305501.png)]

2、创建项目运行虚拟机环境

miniconda支持创建多个虚拟环境,用来支撑不同版本(python)版本的代码,这里就为chatglm-6b创建一个单独的python虚拟机环境,名字叫:chatglm,后面会在该环境中安装跑chatglm-6b模型的所有依赖。下面是命令及截图:

conda create -n chatglm --clone base  (注:因为是离线安装这里选择clone的方式创建,直接创建会报错)
conda env list
conda activate chatglm

3、安装模型需要的所有依赖

chatglm-6b在centos上用到的所有依赖全都打包在packages里面了(在云盘中,获取方式放在最后),将其也放到/home/work/chatglm/packages下面,然后执行:

pip install --no-index --find-links=/home/work/chatglm/packages  -r requirements.txt

4、获取模型文件

方法一、通过网盘获取模型文件。

方法二、通过Hugging Face获取,连接地址:https://huggingface.co/THUDM/chatglm-6b/tree/main,下载所有的文件。建立chatglm_model文件夹,把下载的所有文件都塞到这里面。

不管通过以上哪种方法:将模型文件放到机器目录:/home/work/chatglm/chatglm_model下面。

5、获取项目webui

方法一、通过网盘获取模型文件

方法二、通过github开源项目获取,连接地址:https://github.com/Akegarasu/ChatGLM-webui,下载所有文件。建立webui文件夹,将下载的所有文件都塞到这个文件夹里面。

还是不管按照以上哪种方法获取,将模型文件放到机器目录:/home/work/chatglm/webui里面。

6、启动webui(最后一步)

按照上面的操作,最终的文件夹目录如下:

接着,进入到webui文件夹里面,执行如下命令:

python webui.py --model-path /home/work/chatglm/chatglm_model --listen --port 8898 --precision fp16

上面参数主要是:模型路径、监听端口、以及模型工作模式;除此之外还有其它的几个参数没有用到。所有参数解释具体如下:

 --model-path 指定模型路径

 --listen 如果不加该参数,只能通过127.0.0.0本地访问。注意:在centos服务器上部署,该参数一定要加,不然没有办法通过IP加端口访问模型服务。

 --port 没有啥好说的,指定端口用的。

 --share 通过gradio进行分享,它会帮你生成一个域名连接,但是需要访问互联网。离线centos服务器部署用不到。

 --precision 精度参数有4个,分别是fp32(只用CPU,32G内存以上), fp16,(12G以上显存) int4(8G以下显存使用), int8(8G显存使用)

 --cpu 只应用CPU,无显卡的时候使用

执行完以上命令之后,等待模型加载完成,通过IP+端口就可以访问服务啦!截图如下
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zxekwPZs-1680244896974)(C:\Users\Lenovo\AppData\Roaming\Typora\typora-user-images\image-20230331143457044.png)]

7,资料获取

在这里插入图片描述
下载方式 关注: AINLPer 回复:chatglm6B

推荐阅读

[1] EMNLP2022 | 带有实体内存(Entity Memory)的统一编解码框架 (美国圣母大学)

[2] NeurIPS2022 | 训练缺少数据?你还有“零样本学习(zero-shot Learning)”(香槟分校)

[3] 一文了解EMNLP国际顶会 && 历年EMNLP论文下载 && 含EMNLP2022

[4]【历年NeurIPS论文下载】一文带你看懂NeurIPS国际顶会(内含NeurIPS2022)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6727.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt回答mysql查询优化

chatgpt对一个查询疑问的回答,比百度强太多了,当你的需求明确的时候,能表达出来自己的疑问,chatgpt给你的回答简直是超凡的。 请教个问题:mysql数据库中有个表xn,表中一个字段“代表号"设置为key, 比如…

您应该查看的5个ChatGPT WordPress插件

要创建免费网站?从易服客建站平台免费开始 500M免费空间,可升级为20GB电子商务网站 您应该查看的5个ChatGPT WordPress插件 发布于 2023年4月1日 ChatGPT 席卷了数字世界。作为内容创建者或营销者,您可能希望通过在您的网站上使用ChatGPT…

体验了基于ChatGPT的谷歌翻译插件后,我把其他翻译插件移除了

最近,一个基于 ChatGPT 的谷歌浏览器翻译插件挺火的,我体验了下,总结下来就一个字“666”。 github 上已经有 14.9k 的 star 了 传送门:GitHub - yetone/openai-translator: 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端…

最近很火的ChatGPT究竟是什么?本文解释得非常全面,还通俗易懂

目录 01 ChatGPT是什么? 02 ChatGPT能做什么? 1)回答问题。 2)撰写文章。 3)总结提炼。 4)生成代码。 03 ChatGPT 的缺点和问题 04 ChatGPT的未来前景 1)搜索。 2)阅读…

ChatGPT迎华人产品老大,斯坦福毕业,扎克伯克最喜欢的产品经理!

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) ChatGPT 大家早已不陌生,那么“Peter Deng”是何许人也? 答案是:ChatGPT 的“新掌门人”! 6 月 1 日,Peter Deng 在 LinkedIn…

2023全国科技工作者日——回顾2023小蛮腰科技大会暨AIGC人工智能峰会,致敬全国科技工作者

文章目录 一、前言二、2023全国科技工作者日三、回顾2023小蛮腰科技大会暨AIGC人工智能峰会3.1 关于小蛮腰科技大会暨AIGC人工智能峰会的背景3.2 2023小蛮腰科技大会:探寻AIGC新未来3.2.1 开幕式暨主论坛3.2.2 平行论坛1&6:迈向智能时代,…

ChatGPT也涨不动了

将深燃设为“星标⭐” 第一时间收到文章更新 深燃(shenrancaijing)原创 作者 | 李秋涵 编辑 | 魏佳 你还在用ChatGPT吗? 在全球掀起AI热潮的ChatGPT,似乎进入了瓶颈期。 首先是关于ChatGPT的使用率,有不利的数据出现。…

ChatGPT 也能用来造芯,说说英语就可以了?!

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) ChatGPT 真的那么牛吗? 来自纽约大学 Tandon 工程学院的研究人员发布了一篇《Chip-Chat: Challenges and Opportunities in Conversational Hardware Design》论文,用实验回答道…

衔远科技天使轮融资数亿元打造ChatGPT助力企业创新数智化

日前,全球领先的专注于企业创新数智化的技术服务公司衔远科技宣布已经完成数亿元天使轮融资,本轮融资由启明创投领投,经纬创投跟投。 衔远科技成立于2021年底,致力于让每一件商品都应需而生,让每一位消费者都得偿所愿。…

从GPT-1到GPT-4看ChatGPT的崛起

整理了一下ChatGPT的发展历程、背后的技术原理,以及它的局限性在哪。(请注意:有部分内容来自于文内的参考资料,如有兴趣还请阅读原文,本文不构成任何投资建议或者对项目的推荐) *转载请扫码添加后台微信二维…

ChatGPT常用prompts汇总

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

ChatGPT Prompt Engineering for Developers(面向开发人员的 ChatGPT 提示工程)资源汇总

ChatGPT Prompt Engineering for Developers(面向开发人员的 ChatGPT 提示工程)资源汇总 吴恩达老师上新课了《开发者的ChatGPT提示工程课程》。 官网地址: 链接地址为ChatGPT Prompt Engineering for Developers B站中英文字幕视频 01.…

太太太恐怖了!闲来无事测试了一下chatGPT,感觉人类危机要成真了!

太太太恐怖了!闲来无事测试了一下chatGPT,感觉人类危机要成真了!

留学论文写作中引用ChatGPT创建的内容会被允许吗?

【欧洲时报2月28日编译】在智能聊天机器人ChatGPT在全球掀起热潮之际,国际文凭组织(International Baccalaureate,下称IB)近日表示,学生可以在论文写作中引用ChatGPT创建的内容。 英国《卫报》报道,IB是A-l…

玩转ChatGPT:Transformer分类模型

一、写在前面 之前,我们介绍了Sklearn包以及Boost辈的各种分类模型,这些模型都很经典了,实际上也很强大,比如说Xgboost。 然而,近期随着ChatGPT的大火,其底层框架Transformer也逐渐火了,现在大…

ChatGPT进化的过程简介

Chat GPT可以做什么? 分点列条的回答问题 写代码或SQL 翻译 语法检查 ChatGPT官方还未公开论文,ChatGPT有一个“孪生兄弟”InstructGPT,InstructGPT有论文,可以根据InstructGPT论文推导ChatGPT的训练过程: ChatGPT的…

Chatgpt频繁“something went wrong”需要刷新的解决办法

问题描述: 使用Chatgpt问一两个问题或者过一段时间再提问就会出现下图: 需要频繁刷新,很影响体验。 解决办法: 【2023.4.23更新】 目前亲测可用的方法是在edge浏览器(火狐浏览器貌似也可以,chrome不可以…

【视频文稿】车载Android应用开发与分析 - 走进车载操作系统

本期内容的视频地址:https://www.bilibili.com/video/BV1rR4y1B7Qd/ Hello,各位好,我是一个做车载软件开发的软件工程师,之前在CSDN、稀土掘金这些平台上发表过一些车载应用方面的文章,期间得到了许多朋友的反馈。2023…

Midjourney|文心一格prompt教程[Text Prompt(下篇)]:游戏、实物、人物、风景、动漫、邮票、海报等生成,终极模板教学

Midjourney|文心一格prompt教程[Text Prompt(下篇)]:游戏、实物、人物、风景、动漫、邮票、海报等生成,终极模板教学 场景6:游戏 Prompt 真的越长越好吗? 按照 Midjourney 的官方文档里的说法&#xff0…

OpenAI开源3D模型生成器;IBM将推出AIGC平台Watsonx;百度正在内测文心千帆大模型平台丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 OpenAI开源3D模型生成器Shap-E 5月10日,OpenAI公开了其最新的开源模型Shap-E,这款创新型3D模型生成器能将描述性的文本转化为相应的3D模型。用户只需提供描述性的文本,就能生…