本地部署ChatGLM-6B模型(使用JittorLLMs大模型推理库)

简介

网上冲浪时发现的这两个国产模型,重点是对硬件的要求并不高,有2GB内存就可以跑,觉得有趣就弄来玩了下。

https://github.com/Jittor/JittorLLMs
https://github.com/THUDM/ChatGLM-6B

简单介绍下用到的仓库

ChatGLM-6B

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

JittorLLMS

JittorLLMS是基于ChatGLM-6B开发的开源项目。
成本低:相比同类框架,本库可大幅降低硬件配置要求(减少80%),没有显卡,2G内存就能跑大模型,人人皆可在普通机器上,实现大模型本地部署;是目前已知的部署成本最低的大模型库。

效果

系统:win10
环境:python 3.9.10
cpu:i7-8750H
显卡:GTX-1050Ti
内存:16GB 2666 MHz

如下图所示,可以发现就凭我这5年前的笔电都可以运行起来,还是挺不错的,就是回答的效果不太好 一个回答需要好几分钟才能说完。
请添加图片描述
请添加图片描述

开始安装

安装Python

这里不做赘述,版本要求至少3.8。版本不够的小伙伴需要做下版本的升级

下载安装依赖

可以通过环境变量JITTOR_HOME指定缓存存放路径,默认存放在C盘的user下
在这里插入图片描述

# 国内使用 gitlink clone
git clone https://gitlink.org.cn/jittor/JittorLLMs.git --depth 1
# github: git clone https://github.com/Jittor/JittorLLMs.git --depth 1
cd JittorLLMs
# -i 指定用jittor的源, -I 强制重装Jittor版torch
pip install -r requirements.txt -i https://pypi.jittor.org/simple -I

如果出现找不到jittor版本的错误,请更新版本:

pip install jittor -U -i https://pypi.org/simple

安装中若有其他错误,安装python对应的提示信息完成就可以。
如果遇到 transformers 下载失败,尝试使用VPN 将节点放到新加坡 再重新下载,我之前的节点在香港 导致一直下载失败。

部署启动

部署只需一行命令即可:

python cli_demo.py [chatglm|pangualpha|llama|chatrwkv]

运行上面的命令会下载模型文件到本地根目录(C盘)
JittorLLMs 支持4个语言模型的运行

等待模型下载完成后,没有出现红色字体报错,且出现了生成进度 并出现了用户输入: 这几个字,那么恭喜 你的模型运行成功,可以愉快的训练了

若输入指令后 没几秒模型崩了,就是出现如下那种错误了 或内存警告之类的在这里插入图片描述

原因是JittorLLM需要使用的显存和内存超过了我们电脑配置的极限,设置下JittorLLM的环境变量,节省内存:

export JT_SAVE_MEM=1
# 限制cpu最多使用16G   就是内存
export cpu_mem_limit=16000000000
# 限制device内存(如gpu、tpu等)最多使用8G
export device_mem_limit=8000000000
# windows 用户,请使用powershell
# $env:JT_SAVE_MEM="1"
# $env:cpu_mem_limit="16000000000"
# $env:device_mem_limit="8000000000"

内存设置小技巧
为了更好的发挥性能并使JittorLLM不被回收,我们设置内存与GPU显存可用量 可用按如下的公式来:
内存:总内存-当前已用内存-500MB预留的内存
GPU显存:总显存-当前已用显存-500MB预留显存
以上并不一定是最优,至少可用保证运行后被系统给回收掉

用户可以自由设定cpu和设备内存的使用量,如果不希望对内存进行限制,可以设置为-1

# 限制cpu最多使用16G
export cpu_mem_limit=-1
# 限制device内存(如gpu、tpu等)最多使用8G
export device_mem_limit=-1
# windows 用户,请使用powershell
# $env:JT_SAVE_MEM="1"
# $env:cpu_mem_limit="-1"
# $env:device_mem_limit="-1"

JittorLLM 文档已经写的很清楚了,可以在仓库看到更多的操作

简单记录,回忆不迷路

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5841.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决注册错误:OpenAI‘s services are not available in your country.

登录AI服务时提示如下错误,意思是该服务不在当前国家提供,需要用魔法移动到其他国家。 参考: https://readdevdocs.com/blog/makemoney/%E4%B8%AD%E5%9B%BD%E5%8C%BA%E6%B3%A8%E5%86%8COpenAI%E8%B4%A6%E5%8F%B7%E8%AF%95%E7%94%A8ChatGPT%E6…

ChatGPT 抢不走程序员饭碗的原因找到了?最新研究:它自动生成了 21 个程序,16 个有漏洞...

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 一个好消息与一个坏消息。 好消息是,继 ChatGPT、GPT-4 等产品之后,代码生成工具的队伍再添新员。Google 近日宣布 Bard 可以辅助软件开发者完成编程和软件开发任务,…

解决 OpenAI‘s API is not available in your country.

首先你要确认自己连的节点不属于以下任何一个国家。 如果你确定你连的节点不属于上图的任何一个国家还是显示not available,那么有两种情况。 一.你的科学上网工具的设置。例如我用的是ssr,我打开了服务器负载均衡,它就会自动的在我所有的节…

解决chatGPT出现Not available OpenAI`s services are not available in your country.的问题

一、问题描述 chatGPT出现不允许该地区访问问题 二、解决地区问题 1、清除浏览器缓存 2、地址栏输入以下内容 javascript:window.localStorage.removeItem(Object.keys(window.localStorage).find(i>i.startsWith(‘auth0spajs’))) 请注意,javascript:是粘贴不…

【关于ChatGPT的30个问题】3、ChatGPT的主要功能是什么? / By 禅与计算机程序设计艺术

3、ChatGPT的主要功能是什么? 目录 3、ChatGPT的主要功能是什么? ChatGPT:一种基于人工智能的智能对话机器人

ChatGPT在源代码分析中可靠吗?

引文 ChatGPT自发布以来,它在各行各业都掀起了一股学习热潮。由于其惊人的语言理解和生成能力,ChatGPT已经备受全世界瞩目。它在智能对话、翻译、摘要、文本生成等领域中展现出了非凡的能力,让人们对其充满了好奇、敬畏和赞叹之情&#xff0…

我听过的最不可能的预测就是「ChatGPT 会取代程序员的工作」—— 恰恰相反,因为 ChatGPT 等工具的出现,我断言未来的十年里,中国新增 5 亿以上的程序员。

最不可能的预测 我听过的最不可能的预测是「ChatGPT 会取代程序员的工作」。 恰恰相反,因为 ChatGPT 等工具的出现,我断言未来的十年里,中国新增 5 亿以上的程序员。 程序员的效率提升一直在飞速进行 有人说因为 ChatGPT 可以写程序了,所以程序员要失业了。但是,在程序员…

淘汰我们的,从来都不是ChatGPT,而是背后那个使用ChatGPT的人

大家是不是被ChatGPT,被midjourney刷屏了? “许多岗位将要被AI所取代”的言论甚嚣尘上,很多人都开始焦虑,什么时候会轮到我? 我的观点是:千万别为AI新技术的出现而感到焦虑,ChatGPT的出现&#…

从ChatGPT与New Bing看程序员为什么要学习算法?

文章目录 为什么要学习数据结构和算法?ChatGPT与NEW Bing 的回答想要通关大厂面试,就不能让数据结构和算法拖了后腿业务开发工程师,你真的愿意做一辈子CRUD boy吗?对编程还有追求?不想被行业淘汰?那就不要只…

黑马威武||《ChatGPT全通关》免费学

2023年,不会还有人不知道ChatGPT吧。 它是史上最快突破1亿用户的软件产品,上线即刷爆各大社交平台,多次霸榜微博热搜,它衍生出了无数副业,甚至有人用它两个月狂赚30万...... 比尔盖茨都评论说“这将改变我们的世界”…

【AutoGPT】AutoGPT出现,是否意味着ChatGPT已被淘汰

Yan-英杰的主页 悟已往之不谏 知来者之可追 C程序员,2024届电子信息研究生 目录 前言 什么是ChatGPT? 什么是AutoGPT? AutoGPT与ChatGPT的区别 AutoGPT的优势和劣势 优势 劣势 ChatGPT是否会被淘汰? 前言 近年来&#x…

ChatGPT未来会取代程序员吗?

前言 程序员更多的时间是在调试和修改代码,包括讨论需求同步信息等,然后才是写代码-时间占比最多也就是20%~30%左右,而更时间占比更多的80%左右需要程序员用独立思考能力和批判性思维进行工作,这是ChatGPT目前还做不到的地方。即…

体验了一把ChatGPT,程序员不用写注释了...VSCode+ChatGPT 编程利器

额,作为一名程序员,最烦的就是写注释,写文档,如果能直接在编辑器中直接帮我提供这样的功能,免得开发阶段写大量注释,那么今天,它来了… VSCode是一款开源、轻量级的跨平台集成开发环境&#xf…

科大讯飞辟谣星火大模型套壳ChatGPT;谷歌发布AI语言模型PaLM 2;OpenAI CEO将赴美国为AI辩护丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 英特尔与波士顿咨询公司联合推出企业级生成式AI解决方案 近日,波士顿咨询公司(BCG)和英特尔宣布开展战略合作,为企业客户提供完全定制的专有解决方案,…

互联网晚报 |疑似小米汽车设计效果图曝光;三亚海鲜餐饮协会建议各类珍稀海产品加价50%;亚马逊已在多种工作中使用ChatGPT...

三亚海鲜餐饮协会倡议:建议各类珍稀海产品加价率50%以内 三亚市海鲜餐饮协会发布倡议书。其中提到,不哄抬海鲜及其他消费、服务价格。请全市海鲜餐饮星级商家、海鲜餐饮高质量服务餐厅、大型餐饮企业等标杆餐饮企业发挥模范带头作用,除政府实…

Spring WebFlux 响应式Web框架

Spring WebFlux是随Spring 5推出的响应式Web框架。 服务端技术栈 Spring提供了完整的支持响应式的服务端技术栈。 如上图所示,左侧为基于spring-webmvc的技术栈,右侧为基于spring-webflux的技术栈, Spring WebFlux是基于响应式流的&#x…

学术专用版ChatGPT,开源了!

Datawhale干货 项目:GPT学术版,来源:机器之心 用 ChatGPT 辅助写论文这件事,越来越靠谱了。 ChatGPT 发布以来,各个领域的从业者都在探索 ChatGPT 的应用前景,挖掘它的潜力。其中,学术文本的理…

【SAP】为什么2023年后ABAP仍有广阔前景「来听听ChatGPT怎么说」

💂作者简介: THUNDER王,一名热爱财税和SAP ABAP编程以及热爱分享的博主。目前于江西师范大学会计学专业大二本科在读,同时任汉硕云(广东)科技有限公司ABAP开发顾问。在学习工作中,我通常使用偏后…

我继续问了ChatGPT关于SAP顾问职业发展前景的问题,大家感受一下

目录 SAP 顾问 跟其他IT工作收入情况相比是怎么样的? 如何成为SAP FICO 优秀的顾问 要想成为SAP FICO 优秀的顾问 ,需要ABA开发技能吗 SAP 顾问中哪个类型收入最多? 中国的ERP软件能够取代SAP吗? 今天我继续撩 ChatGPT。随便问…

chatgpt-retrieval-plugin实操上手chatgpt插件的开发

chatgpt发布了插件chatgpt-retrieval-plugin,做为目前热门的技术,恰好我上手python也好几年了,如此热门的东东,不上手实操下有点对不住自己上手好几年的python了。 不多废话了,开始上手这个chatgpt-retrieval-plugin,所用到的环境及技术:win10操作系统、VMware、centos…