ChatGLM-6B 本地部署指南!

 Datawhale干货 

作者:宋志学,Datawhale成员

注意事项-写在最前

  • 显卡需要至少6GB的显存

  • 使用GPU部署模型需要自行安装torch和与自己显卡匹配的CUDA、cudnn

下载ChatGLM-6B

在GitHub上下载chatglm-6b的源码,地址如下

https://github.com/THUDM/ChatGLM-6B

开源双语对话语言模型  | An Open Bilingual Dialogue Language Model

可以使用git clone代码,也可以下载代码压缩包到本地(看你心情)

9c542dd6fea1cafd8dae6de1f7692ce3.png

然后,安装一些包。

pip install -r requirements.txt

下载int4模型

在Hugging Face上下载chatglm-6b int4量化模型地址如下:

https://huggingface.co/THUDM/chatglm-6b-int4

ca88e564112c64d735036820df48f88f.png

这些所有文件都需要下载(可能需要一点点魔法,但是相信聪明的你,一定可以!)

在刚刚下载好的chatglm源码中新建一个用于下载模型文件的文件夹,命名为chatglm-6b-int4(你也可以换一个你喜欢的名字)。将Hugging Face上的int4量化模型下载到里面。

932ecf23204e10fde123d6fecc9ec4db.png

修改源码

web_demo.py

将源码中wei_demo.py文件中的第5、6两行代码中的模型路径修改为chatglm-6b-int4也就是刚刚下载模型的文件夹。如下图所示。

切记:不要用./chatglm-6b-in4不要出现"点杠"的形式,如果你把模型文件放在了其他地方,请务必使用绝对路径,如:"G:\日常文件\Chatgpt相关\ChatGLM-6B\chatglm-6b-int4"。(要使用双斜杠,双斜杠,双斜杠!!!)鼓励你像我这样直接放在源码里面,免去路径问题的困扰。(相信你足够聪明,可以解决这个问题!)

fa1cdf21cf5806b6e7610da46059e8e5.png bebb629b47437ec5159cf30f8beb627c.png

api.py

daf13e9213d34e91b5f6d59cfd4834f0.png 1eb1d9c67a9b44be160a4b3f30b7130e.png

cli_demo.py

3640bcffbe345e24eda537cfdb896f91.png 7b97c79e674cca187f424a0d64e3987d.png

运行代码

web_demo.py

在下载chatglm源码的目录,打开cmd,输入python web_demo.py经过一段时间的等待,出现如下图一样的输出就代表运行成功,在浏览器输入地址:http://127.0.0.1:7860,就可以愉快地使用chatglm啦~

  • gcc报错不需要管,属于windows自己问题,咱们使用GPU运行,gcc与我们无关

    在 CPU 上运行时,会根据硬件自动编译 CPU Kernel ,请确保已安装 GCC 和 OpenMP (Linux一般已安装,对于Windows则需手动安装),以获得最佳并行计算能力。

2a51d4d3a79b5cc0897fa3bfd873d345.png 299fd8f913f6ec9b463b6f669edb70fa.png

可以看到显存占了5.7GB,所以需要至少一张6GB的显存的显卡,再来玩这个。

  • 注意:对话太长也会爆显存。

17c4fbec5d992edc42fcc645ba497903.png

api.py

在命令行输入python api.py,经过一段时间的运行,出现如下输出,就是运行成功。

747e77ddd21d05b46985ccdbf44d9be8.png

按照官网给的示例

curl -X POST "http://127.0.0.1:8000"
-H 'Content-Type: application/json'
-d '{"prompt": "你好", "history": []}'

可以使用python中的requests库进行访问,聪明的你可以把这个代码封装一下实现多轮对话。

import requests
import jsonurl = 'http://127.0.0.1:8000'
headers = {'Content-Type': 'application/json'}
data = {"prompt": "你好", "history": []}response = requests.post(url=url, headers=headers, data=json.dumps(data))
response.json()
a9285df52a6765e233340d69bc028000.png

cli_demo.py

在命令行输入python cli_demo.py,经过一段时间的运行,出现如下输出,就是运行成功。

9f5ce733846cb033291ebf9aa5ec81f5.png

然后,可以和他进行对话,就像运行wei_demo.py一样。

9155dbe3e056b440e676daad671c1f4e.png

086d5ef7e6841bc64028b8ae11f73d69.png

原创不易,三连

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/16163.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何在本地部署运行ChatGLM-6B

在本篇技术博客中,将展示如何在本地获取运行代码和模型,并配置环境以及 Web GUI,最后通过 Gradio 的网页版 Demo 进行聊天。 官方介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM)…

统计行业板块内涨停板数量,跟踪热点板块!股票量化分析工具QTYX-V2.6.0

前言‍‍ QTYX系统结构如下所示: 功能概述 目前A股市场的股票每天是有限制最大涨幅的,也就是涨停的概念。比如主板个股最大涨幅是10%,创业板个股最大涨幅是20%等。 对于个股而言并不是随随便便就能被推到涨停板的,它的背后是主力资…

股票数据分析

股票数据分析 前面我们介绍了Spark 和 Spark SQL,今天我们就使用 Spark SQL来分析一下我们的数据,今天我们主要分析一下股票数据 数据准备 这里郑重申明,我们的全部数据来自tushare, tushare 是一个免费提供各类金融数据 , 助力智能投资与…

华为版 ChatGPT“盘古 Chat”2023年7月7日正式发布

据某些媒体称,华为公司将发布一款直接对标 ChatGPT 的多模态千亿级大模型产品,名为“盘古 Chat”。 据介绍,盘古大模型于 2020 年 11 月在华为云内部立项成功。这款“盘古 Chat ”预计将于今年 7 月 7 日举行的华为云开发者大会 (HDC.Cloud …

苹果上演“无间道”?故意泄露假消息“钓鱼”,成功抓获 iOS 17 内部爆料者...

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 在今年 3 月底,苹果预告了 WWDC23 大会的时间:北京时间 6 月 6 日至 10 日。据外媒预测,iOS 17、新款 MacBook Air 和 M3 芯片都有可能在本次大会中亮相。 然而对于…

被 Google 裁掉的 Golden 12K:开源开发者成重灾区,61 岁再求职!

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 2022 被视为全球经济的低谷期,如今 2023 新一年的到来,被众人赋予了很高的期望。 然而,新年伊始,全球科技巨头之一的 Google 最新宣布大规模裁员的消息&a…

简单聊聊工程质量中研发需要关心的点

一、背景 作为程序猿,工程质量是我们逃不开的一个话题,工程质量高带来的好处多多,我在写这篇文章的时候问了一下CHATGPT,就当娱乐一下,以下是ChatGPT的回答: 1、提高产品或服务的可靠性和稳定性。高质量的系…

ChatGPT不会很快接管人类工作,AI也不会免费打工

ChatGPT 等大模型的相继发布,让很多人倍感压力,害怕 AI 会很快接管他们的工作。对此,OpenAI 也曾发表过一项研究,表明 ChatGPT 的影响涵盖所有收入阶层,且高收入工作可能面临更大的风险。事实到底如何呢? …

AI辅助编程实践-Copilot

引言 在ChatGPT的浪潮下,当前大模型普遍引入了编程问题平台以及大量代码数据来训练逻辑和问答能力,同时大模型本身具备的自然语言理解和处理能力,使得我们可以与大模型进行代码编程上的交流与咨询,大大减少我们在一些琐碎事务上的…

chatgpt赋能python:Python动态调用方法:优雅的编程解决方案

Python动态调用方法:优雅的编程解决方案 Python语言的特性之一是其动态性。这意味着Python在运行时不仅能够创建新的对象和修改现有对象的属性,还可以动态地调用方法。这种能力在编写大规模的Python应用程序时格外有用。本文将深入探讨Python动态调用方…

聚观早报 | ChatGPT登顶美区iOS免费榜;库克不满苹果首款MR设备

今日要闻:ChatGPT登顶美区iOS免费榜;库克不满苹果首款MR设备;索尼正开发小尺寸折叠屏手机;万达辟谣大规模裁员;智能仿生手让截肢者重获手心的温度 ChatGPT登顶美区iOS免费榜 ChatGPT 在 iOS 美区免费 App 排行榜上位列…

【送书福利】终于有本书讲清了ChatGPT和AIGC

文末送书活动 AIGC的各大门派是谁?典型技术都有什么? AIGC为什么在绘画领域先破圈?ChatGPT的有哪些局限性? 为何科技企业争相推出大模型? 人类的创新能力会被AIGC取代吗…… 诸如此类的这些话题呈现爆发性增长&#xf…

【社区图书馆】人工智能新高度:生成式AI带来新的革命!

引言 很高兴能够参加CSDN & 机械工业出版社联合举办的深读计划活动,非常荣幸被选中获得纸质版的《你好,ChatGPT》这本书,在这里再次感谢CSDN、机械工业出版社给我的这个阅读机会,我个人也是非常珍惜这次深读计划,经…

终于有本书把ChatGPT和AIGC讲清了!

AIGC的各大门派是谁?典型技术都有什么? AIGC为什么在绘画领域先破圈?ChatGPT的有哪些局限性? 为何科技企业争相推出大模型? 人类的创新能力会被AIGC取代吗…… 诸如此类的这些话题呈现爆发性增长,频频被科技…

ATA笔记

目录 One Model to Serve ALL:多场景下的星型CTR预估模型STAR 解决问题 网络结构 Scenario-Specific FCN Scenario-Specific Linear Transformation Master & Auxiliary Network LinUCB介绍 Mix_Loss:稀疏高客单场景下成交Loss设计 GMSL: GRU-based Mu…

一文看尽SOTA生成式模型:9大类别21个模型全回顾!

来源:新智元 极市平台 本文约3800字,建议阅读5分钟本文总结了2022年发布的21个生成式模型,一次看明白生成式模型的发展脉络! 过去的两年时间里,AI界的大型生成模型发布呈井喷之势,尤其是Stable Diffusion开…

多模态大模型综述: LLaVA, MiniGPT4

文章目录 LLaVA一. 简介1.1. 摘要1.2. 引言 二. 相关工作三. 基于GPT辅助的视觉指令数据生成四. Visual Instruction Tuning4.1 网络结构4.2 训练 5 实验5.1 多模态聊天机器人5.2 ScienceQA MiniGPT4一. 简介1.1 Overview 二. 方法2.1 网络结构图2.2 第一阶段训练2.3 高质量对齐…

被称为下一代风口的AIGC到底是什么?

近期,短视频平台上“AI绘画”的概念爆火,ChatGPT这一词条也刷爆了科技圈,而这些概念同属于一个领域——AIGC。2022年12月,Science杂志发布的2022年度科学十大突破中,AIGC入选。 那么,被称之为是AI下一代风…

Postman如何设置成中文?(汉化)

1. 点击下方这个链接,进入gitee,在里面下载一个插件 Releases hlmd/Postman-cn GitHub 进入之后是这个样子的: 2.看一下自己的postman是什么版本的,然后在gitee下载对应的APP包(注意:是App.zit包。不要下…

强大的编辑器 Cursor,免费集成了 ChatGPT-4

AI 时代来临,还不会利用工具帮助你工作,很容易就会被淘汰了。 就在上一周是 AI,集体亮相的一周,ChatGPT-4、new-bing、文心一言、Claude 等等,一一体验过这些工具,能明显感觉到作为 CV 工程师的焦虑。 在…