两小时搭建自己的ChatGLM免硬件

目录

准备(注册):

搭建:

API模式:

测试:

总结:


准备硬件(注册):

注册modelscope(底层阿里云)免费使用服务器

https://modelscope.cn/

按照图片里的选择(选择其他好像不能创建成功)

可以白嫖60多个小时的配置

8核 32GB 显存16G
预装 ModelScope Library
预装镜像 ubuntu20.04-cuda11.3.0-py37-torch1.11.0-tf1.15.5-1.5.0

ChatGLM-6B介绍

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。

硬件需求

量化等级最低 GPU 显存(推理)最低 GPU 显存(高效参数微调)
FP16(无量化)13 GB14 GB
INT88 GB9 GB
INT46 GB7 GB

搭建:

https://github.com/THUDM/ChatGLM-6B#代码调用

按照官网提示操作即可

>>> from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
>>> model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
>>> model = model.eval()
>>> response, history = model.chat(tokenizer, "你好", history=[])
>>> print(response)
你好👋!我是人工智能助手 ChatGLM-6B,很高兴见到你,欢迎问我任何问题。
>>> response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
>>> print(response)
晚上睡不着可能会让你感到焦虑或不舒服,但以下是一些可以帮助你入睡的方法:1. 制定规律的睡眠时间表:保持规律的睡眠时间表可以帮助你建立健康的睡眠习惯,使你更容易入睡。尽量在每天的相同时间上床,并在同一时间起床。
2. 创造一个舒适的睡眠环境:确保睡眠环境舒适,安静,黑暗且温度适宜。可以使用舒适的床上用品,并保持房间通风。
3. 放松身心:在睡前做些放松的活动,例如泡个热水澡,听些轻柔的音乐,阅读一些有趣的书籍等,有助于缓解紧张和焦虑,使你更容易入睡。
4. 避免饮用含有咖啡因的饮料:咖啡因是一种刺激性物质,会影响你的睡眠质量。尽量避免在睡前饮用含有咖啡因的饮料,例如咖啡,茶和可乐。
5. 避免在床上做与睡眠无关的事情:在床上做些与睡眠无关的事情,例如看电影,玩游戏或工作等,可能会干扰你的睡眠。
6. 尝试呼吸技巧:深呼吸是一种放松技巧,可以帮助你缓解紧张和焦虑,使你更容易入睡。试着慢慢吸气,保持几秒钟,然后缓慢呼气。如果这些方法无法帮助你入睡,你可以考虑咨询医生或睡眠专家,寻求进一步的建议。

解释

from transformers import AutoTokenizer, AutoModel:这是从transformers库中导入AutoTokenizer和AutoModel类。tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True):这一行代码通过调用AutoTokenizer类的from_pretrained方法,从“THUDM/chatglm-6b”模型地址中下载并加载对应的tokenizer。该tokenizer是用于将文本转换为模型可以处理的输入向量。model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda():这一行代码通过调用AutoModel类的from_pretrained方法,从“THUDM/chatglm-6b”模型地址中下载并加载对应的模型。同时,它还将模型转换为半精度浮点数(half)和CUDA张量(cuda)。这些操作有助于提高模型的计算速度和性能。model = model.eval():这一行代码将模型设置为推理模式,即禁用dropout和batch normalization等训练时使用的技巧。这有助于提高模型在测试和实际应用中的准确性。

其中 下载需要漫长的等待

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True):

测试安装

API模式:

官网参考这段

GitHub - THUDM/ChatGLM-6B: ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型

git clone https://github.com/THUDM/ChatGLM-6Bcd ChatGLM-6Bpip install fastapi uvicornpython api.py

测试:

curl -X POST "http://127.0.0.1:8000" -H 'Content-Type: application/json' -d '{"prompt": "我叫daniel,给我写本书", "history": []}'

遇到的问题

异常1:
RuntimeError: CUDA Error: no kernel image is available for execution on the device
>>> model = model.quantize()
╭─────────────────────────────── Traceback (most recent call last) ────────────────────────────────╮
│ in <module>:1                                                                                    │
╰──────────────────────────────────────────────────────────────────────────────────────────────────╯
TypeError: quantize() missing 1 required positional argument: 'bits'


model = model.quantize(4)
改成

model = model.quantize(128)


异常2:

root@eais-bjtryzm9xivr28qvprxr-7c8cfdfd44-2j4rx:/mnt/workspace/ChatGLM-6B/ptuning# bash train.sh
Traceback (most recent call last):
  File "main.py", line 29, in <module>
    from rouge_chinese import Rouge
ModuleNotFoundError: No module named 'rouge_chinese'

 安装依赖解决 : pip install rouge_chinese nltk jieba datasets

异常3: 
 RuntimeError: CUDA Error: no kernel image is available for execution on the device
“调整 quantization_bit 来被原始模型的量化等级,不加此选项则为 FP16 精度加载”

bash train.sh
cp   train.sh train_bak.sh

vi train.sh
删除   --quantization_bit 4

异常4:
pip install cpm_kernels

ImportError: This modeling file requires the following packages that were not found in your environment: cpm_kernels. Run `pip install cpm_kernels`


 

总结:

ChatGLM 完全傻瓜式的教程,按照官网操作就行了。

ModelScope太给力了,本来都打算自己买机器运行了,正好有使用的机会。

自己windows11 GTX3060 12g 显卡也不能运行完成的项目

参考资料:

ModelScope 魔搭社区

GitHub - THUDM/ChatGLM-6B: ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/11902.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

宝塔反代教程+国内服务器访问openai api接口+502 Bad Gateway问题解决!

前言 宝塔反代教程国内服务器访问openai api接口502 Bad Gateway问题解决! 此方法最简单快捷&#xff0c;没有复杂步骤&#xff0c;不容易出错&#xff0c;即最简单&#xff0c;零代码、零部署的方法。 实现前提 一台海外VPSOpenAI官方的API_KEYChatGPT网站系统源码 ChatGP…

Swift 周报 第二十九期

文章目录 前言新闻和社区担心泄密&#xff01;外媒&#xff1a;苹果公司限制员工使用ChatGPT苹果公司大幅削减其MR头显销售预期&#xff0c;不足百万台 提案通过的提案正在审查的提案 Swift 论坛1、讨论 SwiftUI 图表、超大数据集和图表叠加2、讨论带有线程安全属性包装器的可发…

ChatterBot+第三方中文语料库实现在线聊天机器人

设计并实现一个在线聊天机器人案例 1、ChatterBot ChatterBot是Python自带的基于机器学习的语音对话引擎&#xff0c;可以基于已知的对话库来产生回应。ChatterBot独特的语言设计可以使它可以通过训练来用任何一种语言进行对话。该项目的开源代码链接&#xff1a;https://git…

ChatGPT不是聊天机器人,是任何人值得重视的竞争对手。

ChatGPT使用了一种聊天界面来和用户互动&#xff0c;用户的理解成本降低&#xff0c;通过输入文字&#xff0c;来得到各种反馈。有预见性的创造者们&#xff0c;已经挖掘ChatGPT所展示出来的各种能力应该如何更好地融入我们的日常生活中。比如&#xff0c;生成菜谱、音乐播放列…

手机号发验证码实现用户注册登录

一.技术及思路 二.案例编写 配置环境&#xff1a;使用docker新建redis,mysql&#xff0c;rabbitmq的容器 MySQL&#xff1a;启动docker服务 systemctl start docker 查看docker服务状态 systemctl status docker 查看目录进入mysql目录下&#xff0c;然后新创建一个容器&#x…

chatgpt了解(一)

狂飙的ChatGPT&#xff0c;为什么是OpenAI最先做出来&#xff1f; ChatGPT 的训练集来自哪里&#xff1f;

chatgpt赋能python:Python运行卡住?这是由什么原因引起的?

Python运行卡住&#xff1f;这是由什么原因引起的&#xff1f; 如果你是一个有10年Python编程经验的工程师&#xff0c;那么你经常会遇到Python运行卡住的情况。在这篇文章中&#xff0c;我将告诉大家Python程序在运行过程中可能会遇到的问题&#xff0c;以及如何解决这些问题…

OpenAI掌门人Sam Altman:AI的下一个发展阶段

来源&#xff5c;Greylock OneFlow社区编译 翻译&#xff5c;胡燕君、贾川 预告了一整年的GPT-4迟迟没来&#xff0c;人们猜想OpenAI是不是要跳票了&#xff0c;更何况他们之前的得意之作DALL-E也被开源Stable Diffusion打了个措手不及&#xff0c;再不来点深水炸弹业界地位危矣…

中国最容易和最难被ChatGPT所代替的 TOP25 职业

作者&#xff1a;chenqin https://zhuanlan.zhihu.com/p/620334140 OpenAI 研究人员曾发文称「约 80% 美国人的工作将被 AI 影响」。 文章的结论是&#xff0c;至少80%的美国劳动力会受到影响&#xff0c;他们的工作的10%会被GPT所替代。其中甚至有19%的美国劳动力的50%工作会被…

美国最新调查显示 50% 企业已在用 ChatGPT,其中 48% 已让其代替员工,你怎么看?

美国企业开始使用ChatGPT&#xff0c;我认为这不是什么新闻。 如果美国的企业现在还不使用ChatGPT&#xff0c;那才是个大新闻。 据新闻源显示&#xff0c;已经使用chatGPT的企业中&#xff0c;48%已经让其代替员工工作。 ChatGPT的具体职责包括&#xff1a;客服、代码编写、招…

Python 打造微信群聊天机器人(带操作界面)

前言 这几天我的一个小伙伴问我能不能给 Ta 做一个配置灵活的微信群聊天机器人&#xff0c;之前了解过 itchat 库的使用&#xff0c;我就爽快的答应了&#xff0c;花了一个晚上&#xff0c;终于做出了雏形。 电脑上运行程序如下: 手机上的信息如下: 其实基于 itchat 的微信机…

企业微信群机器人应用

现在很多企业都在使用企业微信进行工作交流&#xff0c;自从企业微信推出群机器人之后&#xff0c;使用企业微信的小伙伴一般都会用机器人来推送定时消息或者提醒等&#xff0c;这样能够为企业工作群的管理提升效率&#xff0c;能很好的帮助企业运营管理工作群&#xff0c;同样…

微信群机器人(仿真企业微信群机器人)

使用过企业微信的朋友应该应该用过企业微信群机器人&#xff0c;它是企业微信的原生功能&#xff0c;你在企业微信群中新建一个机器人&#xff0c;随后就可以获得这个群机器人的web挂钩&#xff0c;调用这个web挂钩并加上消息参数就可以让这个机器人在群内发送消息&#xff0c;…

为何ChatGPT一出现让巨头们都坐不住?

近几个月来&#xff0c;ChatGPT都是当仁不让的舆论话题。 上一次AI在全球范围内引起轰动&#xff0c;还是谷歌的AI机器人AlphaGO下棋战胜围棋世界冠军的时候。 ChatGPT的出现&#xff0c;让国内外几乎所有的科技巨头都坐立不安。 2月1日&#xff0c;谷歌母公司Alphabet首席执…

科技云报道:为何ChatGPT一出现让巨头们都坐不住?

科技云报道原创。 近几个月来&#xff0c;ChatGPT都是当仁不让的舆论话题。 上一次AI在全球范围内引起轰动&#xff0c;还是谷歌的AI机器人AlphaGO下棋战胜围棋世界冠军的时候。 ChatGPT的出现&#xff0c;让国内外几乎所有的科技巨头都坐立不安。 2月1日&#xff0c;谷歌…

产品体验文档模板——ChatGPT案例

今天和大家免费分享产品体验文档模板——ChatGPT案例&#xff0c;包括基本信息、产品信息、市场分析、用户分析、用户分析、产品分析、产品总结多个模块内容 【文档下载】 【文档预览】

【CV】计算机视觉领域的 GAN 模型综述论文笔记

论文名称&#xff1a;Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy 论文下载&#xff1a;https://dl.acm.org/doi/abs/10.1145/3439723 论文年份&#xff1a;ACM Computing Surveys 2021 论文被引&#xff1a;173&#xff08;2022/04/12&#x…

计算机视觉领域论文投稿

文章目录 工程技术大类&#xff08;中科院一区&#xff09;计算机科学大类&#xff08;中科院一区&#xff09;综合性期刊大类&#xff08;中科院一区&#xff09; 中科院分区期刊查询方式&#xff1a;《2020年中国科学院文献情报中心期刊分区表升级版&#xff08;试行&#xf…

论文投稿指南——计算机视觉 (Computer Vision) 顶会归纳

深度学习Tricks&#xff0c;第一时间送达 目录 &#xff08;一&#xff09;计算机视觉顶会 &#xff08;&#xff11;&#xff09;ICCV&#xff1a;International Conference on Computer Vision &#xff08;&#xff12;&#xff09;CVPR&#xff1a;International Confere…

学习新技术,争做新青年:请ChatGPT帮我写一篇计算机视觉分类算法论文

文章目录 学习新技术&#xff0c;争做新青年&#xff1a;你不会还不用 ChatGPT 吧&#xff1f;学习新技术请告诉我最好的图像分类模型是哪个请推荐最新的分类模型是哪个请详细介绍一下 Swin Transformer请给出Swin Transformer的论文链接请帮我分析一下Swin Transformer 的创新…