手把手教你搭建自己本地的ChatGLM

前言

如果能够本地自己搭建一个ChatGPT的话,训练一个属于自己知识库体系的人工智能AI对话系统,那么能够高效的处理应对所属领域的专业知识,甚至加入职业思维的意识,训练出能够结合行业领域知识高效产出的AI。这必定是十分高效的生产力工具,且本地部署能够保护个人数据隐私,能够内网搭建办公使用也十分的方便。

而对于ChatGLM来说最大的优点就是本地能快速部署且需要资源较比与ChatGPT相当低,还要什么自行车,够用就好。甚至能够在一些性能较高的服务器单点部署,INT4 量化级别下最低只需 6GB 显存。而且我们根本不需要那么宽泛的知识面,只需要垂直一个知识领域深度就足够应对较多业务场景,故ChatGLM确实是较好的二次开发基础工具。

那么不继续发表意见了,本地部署ChatGLM还是会遇到较多问题,建议各位先弄清楚本地开发环境以及电脑配置再根据我给出的组件兼容表对照,不同的配置和环境需要采用不同的安装策略。当然我也只有一台电脑部署很多情况没遇到也不知道如何处理,若是大家根据我的文章部署遇到困难请在评论区或者私信告知我,谢谢各位的支持。

部署依赖

1.硬件需求

这是ChatGLM的开源项目:https://github.com/Fanstuck/ChatGLM-6B。里面可以看到硬件需求,这是硬性要求如果不满足肯定是部署不了的,只能升级电脑配置了:

在这里插入图片描述

2.环境需求

再看依赖文件requirements.txt:

在这里插入图片描述

很多人这里就已经开始pip install -r requirements.txt,但是这里需要注意的是torch下载会出问题,而且大概率下载的会是cpu版本。我这里不建议直接pip install,对于有GPU的同学来说肯定下载GPU版本的torch最优,且不清楚自己cuda的版本下很容易下载的torh和cudnn版本不兼容,所以这里单独说一下torch该如何安装合适的版本。

首先先看一下NVIDIA支持最高的cuda版本:

cmd输入nvidia-smi就可以看到:

在这里插入图片描述

这里显示我的cuda版本为11.7,下载比这低的版本就好了。

但是这里需要注意cuda版本和torch版本是对应的:

pytorch历史版本下载:

https://pytorch.org/get-started/previous-versions/,只要低于11.7版本的torch都是可以的。
在这里插入图片描述

若是pip下载time out的下载wheel:https://download.pytorch.org/whl/torch_stable.html

模型下载

下载ChatGLM有两种方式,一种是通过transformers直接下载,通过调用代码就可以下载到本地,下载默认本地的目录为:

C:\Users.cache\huggingface\modules\transformers_modules

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
model = model.eval()

当然下载太慢的话也可以在Hugging Face Hub里面下载:https://huggingface.co/THUDM/chatglm-6b

不需要frok直接clone就可以了。版主还提供了不同编译后的版本可供下载,我这边就下载了已经编译后的int4版本,我的内存只有16G且显存128M很低故带不起原生模型。

在这里插入图片描述

这样的话文件不需要下载到C盘下面,可以自己选择要下载的目录。

下载完成之后里面提供了两个demo可以测试,需要修改函数AutoTokenizer.from_pretrained中的THUDM/chatglm-6b,也就是pretrained_model_name_or_path更换成你下载chatGLM的目录就可以使用了。

如果你的显存配置有限的话可以选择以量化方式加载模型,比如:

# 按需修改,目前只支持 4/8 bit 量化
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).quantize(4).half().cuda()

模型量化会带来一定的性能损失,经过测试,ChatGLM-6B 在 4-bit 量化下仍然能够进行自然流畅的生成。

量化过程需要在内存中首先加载 FP16 格式的模型,消耗大概 13GB 的内存。如果你的内存不足的话,可以直接加载量化后的模型,仅需大概 5.2GB 的内存:

model = AutoModel.from_pretrained("THUDM/chatglm-6b-int4", trust_remote_code=True).half().cuda()

我这边直接下载的int4模型不需要再加载整个模型了。

如果你没有 GPU 硬件的话,也可以在 CPU 上进行推理,但是推理速度会更慢。使用方法如下,需要大概 32GB 内存:

model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).float()

模型使用

以我的计算机来说平常内存就有
在这里插入图片描述

11G占用了,运行该模型肯定会报OOM,推荐大家把一些暂时不需要的进程杀掉尽可能多的留多点内存再跑模型:

这里推荐在终端上面运行不要用pycharm,内存更多:
在这里插入图片描述

使用web_demo.py可以直接在网站上面对话:

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

我这里直接OOM了没有办法,大家计算机好点就没问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9904.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网页在线沟通工具,网页即时聊天工具-ttkefu完全免费电话呼叫流程图

ttkefu的免费网页电话是怎么回事,应该怎么使用呢?都在哪里能加入免费电话 如图(1)在网站侧边加入免费电话 如图(2)在聊天咨询页面的网页电话 如图(3)点击打开网页电话,输入手机号或电话号。 (图1&#xf…

ChatGPT和New Bing作为AI界新宠,两者有何异同

ChatGPT和New Bing是两个不同的实体,它们之间有一些区别也有一些相似之处。我先说说各自的特点,再汇总说说两者的异同点。 ChatGPT的特点: ChatGPT是一个基于神经网络的自然语言处理模型,能够自动生成自然语言响应。ChatGPT的模…

AI正在取代人工?ChatGPT这样说.....

随着ChatGPT的大火,对于AI机器人的讨论热度空前,它表现出的强大功能性,给当前多领域带来了更多发展可能性,但同时也为该模型带来的一系列技术伦理问题,争议也随之而来。 ChatGPT表现出的智慧与强大令人激动&#xff0…

【人工智能】你知道 ChatGPT 有什么新奇的使用方式吗?请来看看 Open AI 内部工程师都怎么使用 ChatGPT 的

现在,大家基本上把能想到的ChatGPT的使用方法都研究遍了——从写作、写代码,到翻译、英语润色,再到角色扮演等等。 说一个高级的,来看看OpenAI内部是如何使用ChatGPT的。 目录 说一个高级的,来

ChatGPT禁令影响A股吗

3月的最后一天,意大利政府数据保护局暂时禁止OpenAI的ChatGPT,并对其展开涉嫌违反隐私规则展开调查,这是风靡全球3个多月的ChatGPT首次遇到挫折。 据瑞银上月发布的一项研究显示,ChatGPT预计在1月份,即推出两个月后&a…

ChatGPT决定要挑战“考研”,你猜它会上岸吗?

2023年考研 Postgraduate Entrance Examination ChatGPT挑战考研 它能成功吗? 写在前面 在众多“考研人”中,有一个不同寻常的参与者——ChatGPT。这个人工智能模型在2022年12月惊艳亮相,成为了众人关注的焦点。虽然ChatGPT没有身份证&…

AIGC的隐私安全问题及隐私保护技术

作者:京东科技 杨博 ChatGPT 才出现两个月,就已经引起了学术界的关注。微软成为ChatGPT母公司OpenAI的合作伙伴,并确认投资百亿美元。同时,微软正计划将 OpenAI 的技术整合到其产品中,包括Bing搜索引擎和其他软件,以增…

ChatGPT数据安全隐患?本想提高效率,数据却遭泄露

一项新的研究发现,15%的员工经常在ChatGPT上上传公司数据,其中超过四分之一的数据被认为是敏感信息,这使公司在无形中面临安全漏洞的风险。 6月的研究报告《揭示真正的GenAI数据暴露风险》分析了超过10000名员工,主要研究员工如何…

ChatGPT隐私保护的重要性

隐私保护是保障ChatGPT及其用户安全的重要因素。以下是一些关键的隐私保护问题和考虑因素: a. 用户数据处理:ChatGPT在生成回复时,可能会接收和处理用户的输入数据。确保用户数据的安全存储和合规处理,以保护用户的隐私。 b. 匿名…

ChatGPT对高等教育的可能影响与对策建议

ChatGPT来袭,将对高等教育带来哪些影响,我们又该如何应对? 对于ChatGPT,有人欢喜有人忧,不同人、不同领域评价不一。在一些人眼里,它就是天使,而在另外一些人眼里,它几乎可以说是魔…

盛世芳华游戏与微信公众号结合的DDD项目,已接入chatgpt。附源码。

1、项目介绍 基于游戏(盛世芳华)和微信公众号(小屋写随笔)做了该项目(已线上运行一年半 )该 项目将游戏里的部分数据通过微信公众号展示了出来,玩家可以通过发送文字、语音、图片来获取游戏里的处理后数据以及攻略。截至20230315,玩家互动次数已超过160万次。项目最初版本为传…

除了ChatGPT,这几个工具也好用到离谱!

最近几天全网刷爆的ChatGPT AI聊天机器人大家一定都关注了吧?作为设计师的我一直在体验这款 OpenAI 公司推出的聊天机器人,功能确实很强大,体验也还可以。 但是今天,我重新翻了一遍自己的工具收藏夹,整理了5个&#x…

chatGPT对于人类工作和生活产生的重大影响

chatGPT面世以来,不断地进行升级以及学习训练,目前已经在很多方面可以一定程度的替代传统搜索引擎甚至可以替代部分人类工作。 ChatGPT对人类有以下重大好处: 1. 提供即时的帮助和支持:ChatGPT可以在任何时间、任何地点提供即时…

ChatGPT前身GPT的论文-译文

写在前面 论文 Improving Language Understanding by Generative Pre-Training 地址 https://www.cs.ubc.ca/~amuham01/LING530/papers/radford2018improving.pdf ChatGPT火了,改论文作为ChatGPT的前身,可以从这里看到ChatGPT的原始影子。 摘要 自然语言…

ChatGPT 未来会对游戏行业带来哪些影响?

ChatGPT的出现,为整个游戏行业带来了新的思考。 ChatGPT是由微软发布的一个大型语言模型,在被训练之后能够进行对话式文本生成,目前已在多个领域取得了不小的进展,包括聊天机器人、智能客服等。 作为一款大型语言模型&#xff0c…

你可能不需要担心,AI对你的工作造成威胁:万字长文解读科技革命与人类发展

大家好,我是可夫小子,关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加:keeepdance,备注:chatgpt,拉你进群。 上周,AI似乎成为全互联网的焦点了。谷歌在2023IO开发者大会上&#xff0c…

ChatGPT启示录: 智能、推理的本质是什么?神经网络既是推理机,也是知识规则库?

多种因素让人类对自身的智力产生了一种自信,毕竟这个世界上其他生物没有我们大脑发达,智力似乎是上天给人类的独有礼物。作为孩子的父母,老师说孩子不努力似乎是可以接受的,但是说自己娃娃笨是极其羞辱的。 类似的,让很…

ChatGPT必将在文档处理领域大有所为,未来以来,拭目以待【文末送书】

您好,我是码农飞哥(wei158556),感谢您阅读本文,欢迎一键三连哦。 💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精…

ChatGPT对软件开发和软件产品的价值

前言: ChatGPT作为ai对话软件,可以帮你梳理思路,回答专业的问题,检查代码错误,舒缓心情等等;对软件技术人员特别有价值的东西;甚至有人把它当作导师。在ToC上,目前很有优势。 开发…

ChatGPT与软件架构(1) - 快速原型

通过ChatGPT生成设计和原型代码,可以帮助团队快速启动项目,验证想法,提高效率。原文: ChatGPT and Software Architecture Surfing Croyde Bay Unsplash OpenAI的ChatGPT现在越来越火,出现了各种有趣用例。 从许多方面来看&#x…