云平台的ChatGLM部署

最近ChatGPT很火,国内清华也发布了ChatGLM,于是想在云平台上实现一下小型的ChatGLM。目前准备在趋动云这个平台上试试ChatGLM-6B-int8。

目前ChatGLM-6B-int8显存最少需要10G

可以参考GitHub - THUDM/ChatGLM-6B: ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型https://github.com/THUDM/ChatGLM-6B 

第一步:创建一个项目

选择官方pytorch:1.12.1

 数据集选择“公开”里面的ChatGLM-6B-int8预训练结果

 

弹出上传代码 界面,选择暂不上传就行

目前我已将项目公开,大家可以再公开这里找到

进入项目后,选择“开发”,然后选择显存大于9G的配置,我选的是B1.large(B1.medium运存稍微有点不够),将最长运行时间选为“不限制”(这样你就可以手动开关项目啦~),最后点“确定”,等待开发环境运行即可!!!

 第二步:搭建环境

 有图显示表面可以用了,点“进入开发环境”

创建一个.ipynb文件

 在省略号这里点“网页终端”

 进入终端

 在github找到ChatGLM,点击requirements.txt查看环境GitHub - THUDM/ChatGLM-6B: ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型https://github.com/THUDM/ChatGLM-6B

我是在pypi里面下了源文件,装在新建的/download文件夹里面了

然后一个个安装文件即可 (这里只演示一个)

 

在公开项目里面所有环境我已经配好,大家可以直接调用

 第三步:运行代码

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("/gemini/data-1/ChatGLM-6B-int8", trust_remote_code=True)
model = AutoModel.from_pretrained("/gemini/data-1/ChatGLM-6B-int8", trust_remote_code=True).half().cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)

 继续输入

response, history = model.chat(tokenizer, "武汉有什么好玩的地方?", history=history)
print(response)

可以看到在趋动云平台部署ChatGLM-6B-int8非常成功!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/24084.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高通Ziad Asghar:AI处理的重心从云端向边缘侧转移,智能手机是最佳平台 | MEET 2023...

萧箫 整理自 MEET 2023量子位 | 公众号 QbitAI 从Stable Diffusion到ChatGPT,这半年AI算法应用可谓突飞猛进。 但对于硬件领域而言,AI计算的下一个突破口或未来趋势究竟是什么? 尤其是AI应用最大的领域之一——移动端,大量AI算法在…

Stable Diffusion免费(三个月)通过阿里云轻松部署服务

温馨提示:划重点,活动入口在这里喔,不要迷路了。 其实我就在AIGC_有没有一种可能,其实你早就在AIGC了?阿里云邀请你,体验一把AIGC级的毕加索、达芬奇、梵高等大师作画的快感。阿里云将提供免费云产品资源&…

如何通过限制 IP 相关信息 | 控制用户访问站点频率

文章目录 通过 IP 限制反爬实验介绍知识点课程环境 IP 限制实战用 Nginx 限制特定 IP关于 allow 和 deny 的使用说明Nginx 限制 IP 访问频率Python Flask 模拟 IP 黑名单 实验总结 通过 IP 限制反爬 实验介绍 在常规的反爬手段中,IP 限制是应用广泛且比较有效的&a…

win11 报错 你的IT管理员已经限制对此应用一些区域的访问 解决方法

你的IT管理员已经限制对此应用一些区域的访问,你尝试访问的项目不可用。有关详细,请与你的IT支持人员联系。 1.按下wins,在框中输入cmd,右键管理员身份运行 2.在命令提示符中输入 reg add “HKEY_LOCAL_MACHINE\SOFTWARE\Policies\Microsoft\Windows Def…

wordpress开放注册和邮件问题解决

1开放注册 WordPress后台,设置-常规,勾选任何人都可以注册前面的复选框,新用户角色改为作者,保存即可开启。 2新用户注册收不到邮件问题解决 wordpress配置SMTP服务发送邮件(以qq邮箱为例) 第一步、配置邮箱(这里介绍qq邮箱) 我试过多个…

SLAM基础知识汇总【长期更新】

SLAM基础知识汇总 特征点相关 特征点由关键点和描述子构成: 关键点:特征点在图像里的位置描述子:通常是一个向量,描述了该关键点周围的信息,朝向大小等 [ORB-SLAM2] ORB-SLAM中的ORB特征(提取&#xff…

国科大数字图像处理(复习与整理)

图像处理复习笔记: 1、证明一个系统是线性系统2、证明函数卷积的傅里叶变换等于函数傅氏变换后的乘积3、采样定理与混叠4、直方图均衡化第一节课知识点第二节课知识点第三节课知识点第四节课知识点第五节课知识点第六节课知识点第七节课知识点第八节课知识点第九节课…

3D视觉感知新SOTA BEVFormer复现nuscenes数据集测试demo

0 写在前面 分享最近在BEV感知方面的工作,欢迎自动驾驶同行交流学习,助力自动驾驶早日落地。 1.概述 对于自动驾驶而言,BEV(鸟瞰图)下的目标检测是一项十分重要的任务。尽管这项任务已经吸引了大量的研究投入&#…

CCF认证202305-1重复局面

题目背景 国际象棋在对局时,同一局面连续或间断出现3次或3次以上,可由任意一方提出和棋。 问题描述 国际象棋每一个局面可以用大小为 的字符数组来表示,其中每一位对应棋盘上的一个格子。六种棋子王、后、车、象、马、兵分别用字母 k、q、…

地鼠君黑盒测试--小白如何梳理需求,告别听不懂

没有需求文档的痛苦 刚开始作黑盒(功能)测试时,小白难免会遇到这种情况,就是需求梳理不清晰,没有需求文档或者需求文档太简单。这种一开始没人带时,不容易发觉后续测试多痛苦。 笔者一开始时,就…

记一次购买海外服务器的经历和python包管理小记

概述 最近在研究ChatGPT,需要有个服务器一直挂着,刚好看到raksmart在搞活动; 可以关注下,他们的活动页面 https://billing.raksmart.com/whmcs/index.php?rp%2Fannouncements&languagechinese-cn 刚好四月,有便…

No signature of method: build_*.android() is applicable for argument types

意思很直观:就是build的时候,android()的参数错误。 更新android studio 后出现这种问题,主要是新版本的生成的app和module模版有所变化引起的。 Android Studio Electric Eel | 2022.1.1 Patch 1 Build #AI-221.6008.13.2211.9514443, built…

01 Faster R-CNN系列

目录 一、 R-CNN 1. R-CNN流程(4个步骤 ) 2. RP的确定 3. 预训练模型微调(backbone) 4. SVM的分类 5. bbox regression的训练 6. NMS 二、 Fast R-CNN 1. Fast R-CNN算法流程 2. 候选区域生成 3. 预训练模型微调&#…

ChatGPT API 遇见 Tistory:自动化英语学习博客

这是通过集成 ChatGPT API 创建自动化英语学习内容系列中的第三部分。 转发: ChatGPT API Meets Tistory: The Automated English Learning Blogs 项目介绍 介绍 这是通过集成 ChatGPT API 创建自动化英语学习内容系列中的第三部分。 我正在尝试整合各种平台。 第一个是 Se…

cahtgpt算法压力测试(丁真版,更新gpt4(暴风哭泣了已经))

更新 补充了gpt-4版本的答案,只能说牛逼,我收回之前的替代不了高级科研工作者的结论,话不多说上答案: 可以看到这里已经吊打got3.5了,它能把这个问题解释的很清楚了 那么关于GPF算法和varimax的关系呢 可以看到gpt3…

连音乐都可以创作!Google AI部门推出交互式体验

机器学习也能应用在音乐上吗?Google AI部门的Magenta研究项目PAIR计划团队打造出第一个由AI驱动的Doodle服务,Doodle为一项交互式体验,让用户自行创造一段旋律,按下和声演奏(Harmonized)的按钮后&#xff0…

现在程序员的工资是不是被高估了?

图片来源:AIGC 文章来源:www.zhihu.com/question/295009798 韩冬 不是程序员的工资被高估了。而是在中国,IT行业是少有的劳动者议价能力强,能够比较公平的和资方分配公司收入的行业。 最近三十年我国经济突飞猛进,GDP从…

im即时通讯开发/聊天软件系统/社交APP源码搭建/私有化部署聊天原生开发源码快速搭建

由IM技术专家打造的基于 Java 实现的即时通讯(IM)项目 我们提供私有化即时通讯解决方案,独立部署在您自己的服务器上、代码可以开源、支持二次开发、苹果端上线指导,源码出售,提供远程技术指导,全程指导服务…

微分销机制设计_免费快速搭建微信分销商城_OctShop源码

现在微信的流量以及用户基数的庞大,让很多企业或商家都想在微信里面分一杯羹。搭建一个微信分销商城是一个很明智的选择, 而一个比较完善的商城系统,它的设计与开发是庞大复杂的系统工程,比较耗时耗财。 如何快速免费搭建一个大型专业级的微信…

全新开源微商城源码带分销 支持多端+搭建部署教程

分享一个全新版开源微商城源码带分销功能,支持10终端合一,功能强大,含完整代码程序包和搭建部署教程。 系统特色功能一览: 1、一个后台管理所有设备端,支持:电脑H5手机微信ipad微信小程序支付宝小程序百度…