利用腾讯GPU云服务器部署ChatGLM-6B,每小时不到2RMB

目录

  • 萝卜选坑
    • 选择ChatGLM-6B的理由
    • 选择硬件方案
  • 购买GPU云服务器
    • 充值
    • 购买
  • 配置环境
    • 登录服务器
    • 安装显卡驱动
    • 安装CUDA
    • 安装Python
  • 部署ChatGLM-6B
    • 下载项目程序包
    • 安装Pytorch
    • 安装依赖包
    • 检查Pytorch是否为GPU版本
    • 运行网页版Demo
  • 保存镜像

萝卜选坑

生成式AI已经火了好几个月了,各种模型层出不穷,一直想自己搓一个玩玩,但又碰到日常选择性困难,不知道往哪个坑里跳更合适。难点如下:

  • 模型太多,一个都不认识,感觉各个都是无底洞,如何挑选一个?
  • 听说玩AI要显卡,而我只有集显笔记本,搞这个要花多少钱?
  • 搞的AI是否具有可持续性,还是一锤子买卖?

选择ChatGLM-6B的理由

  • 国产,ChatGLM出自于清华系,当前最大的模型为130B,有以下优点:
    在这里插入图片描述

  • 130B的ChatGLM综合性能略高于ChatGPT3,而ChatGPT3以上版本都不开源。
    在这里插入图片描述

  • 有适合单机部署的6B开源版本。这种硬件要求下,一张16G显存的显卡就可以顺滑的跑起来。
    在这里插入图片描述

  • 已有一定的生态环境,未来前景不错。https://github.com/THUDM/ChatGLM-6B
    在这里插入图片描述

选择硬件方案

ChatGLM支持GPU和CPU模式,但听说CPU下速度很慢,就没有什么可玩性。所以还是需要搞一个合适的GPU环境。

一张16G显存显卡起码在1万上下,个人无论是搭台式机还是采用扩展坞,这入门成本都不低。如果资源可以一直得到充分利用,这投资还算划算,如果只是随便试一下的一次性买卖,那这投入就是打了水漂。

现在腾讯云提供适合运算的GPU云服务器,价钱也挺便宜,非常适合入门玩票。

购买GPU云服务器

登录腾讯云,https://cloud.tencent.com/
首先需要有腾讯云账号,没有的话按要求注册。

充值

如题,此部署方案每小时不到2元RMB,但由于创建GPU服务器后会需要先冻结8块多,所以充10元足够用几小时了。

购买

  • 进入购买页

在这里插入图片描述

  • 选择“竞价实例”

在这里插入图片描述

  • 选择离你近的地区
  • 选择机型,如果你选择的地区没有此机型,就换一个地区。选择这个机型的原因是:支持windows,我不熟悉Linux。如果熟悉Linux的可以选择其他机型,成本更低。
    在这里插入图片描述
  • 选择操作系统,这里选择Windows。并选择Windows Server2002 64位中文版的镜像。如果是其他的操作系统,有些支持自动安装GPU驱动,或镜像中自带驱动及其他环境。Windows版本需要自己安装GPU和CUDA驱动。

在这里插入图片描述

  • 设置存储,有两个方案
    单盘模式,一个C盘,75G。为什么是75G?1. 安装运行环境需要较大的空间,50G不够用(本人亲身体验过的尴尬,装一半说空间不足) 。 2. 因为腾讯支持80G免费快照存储,保存快照就不用每次要使用时在此重新安装环境,下文会详细说明。

在这里插入图片描述
多盘模式,一个C盘,50G。一个数据盘,25G。原因也是如上,这个方案的优点是数据可以独立于系统盘挂载。还有一个原因是本人一开始选的50G系统盘不够用了,哈哈。
在这里插入图片描述
- 价格,选择任何云盘类型,配置价格也没有超过2元,这里可以自由选择,一般玩票差异不大。
在这里插入图片描述
- 安全组,注意要打开3389,否则不能连接远程桌面。如果购机完成后,还是无法连接远程桌面,可以使用腾讯云提供的检查功能,然后在检查结果中开启端口。
在这里插入图片描述
- 最后,给服务器起个名字,并设置管理员密码,这也是远程登录的密码。
在这里插入图片描述
- 最终价格,就是前面的配置费用,和网络单价。初始化环境时需要下载几十G的软件和包等。
在这里插入图片描述

配置环境

登录服务器

  • 可以通过本地电脑远程链接GPU云服务器。服务器IP显示在实例列表中。
  • 也可通过服务器列表中的“操作”远程连接服务器。
  • 如果无法连接服务器,使用“自动检查”功能基本都可以排除。

安装显卡驱动

此服务器使用的是NVIDIA Tesla T4,16G显存。Window服务器需要手动安装显卡驱动。
如何安装可以在客服对话框里提问。
在这里插入图片描述
进入Windows驱动安装,按照说明步骤按照。
我选择的是这个:
在这里插入图片描述

安装CUDA

需要ChatGLM支持GPU模式的话,就必须按照CUDA。
如何安装可以在客服对话框里提问,如上。
我下载的是这个版本。
在这里插入图片描述

安装Python

  • Python安装,从官网下载(https://www.python.org/downloads/),我下载的是3.11

  • 安装后如果pip命令提示不存在,使用以下命令安装,如果pip命令存在,就跳过此步。

py -m ensurepip --upgrade
  • 修改pip安装包下载地址,因为默认是从国外下载,速度很慢。
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
pip config set install.trusted-host mirrors.aliyun.com 

部署ChatGLM-6B

下载项目程序包

  • 从GitHub下载项目程序包,https://github.com/THUDM/ChatGLM-6B
  • 下载后解压到本地目录,如D:\ChatGLM\ChatGLM-6B-main
  • 下载模型包chatglm,https://huggingface.co/THUDM/chatglm-6b/tree/main
    • huggingface里不能打包下载,只能一个个下载(因为没有找到打包下载的地方),下载到D:\ChatGLM\ChatGLM-6B-main\chatglm-6b。
    • 8个模型文件(1G以上的那8个)不用在huggingface里下载,从这里下载:https://cloud.tsinghua.edu.cn/d/fb9f16d6dc8f482596c2/

安装Pytorch

在项目文件的requirements.txt里是有Pytorch的,但是自动安装时安装的是CPU的版本,就无法使用GPU,这里我搞了很久,也可能是因为我对这方面还不熟悉,前面有些步骤不正确导致的。
我手动安装了CUDA版本的Pytorch,在Pytorch官网生成安装命令,https://pytorch.org/get-started/locally/
在这里插入图片描述
执行生成的命令就可以安装Pytorch了。

安装依赖包

在项目目录中执行:

pip install -r requirements.txt

检查Pytorch是否为GPU版本

在python中运行

>>> import torch
>>> torch.cuda.is_available()
True

返回True说明现在为GPU版本

运行网页版Demo

  • 修改模型路径,编辑web_demo.py,修改路径为模型包保存的目录
#model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
model = AutoModel.from_pretrained("D:\ChatGPT\ChatGLM-6B-main\chatglm-6b", trust_remote_code=True).half().cuda()
  • 执行如下命令,运行网页版本的demo,如下
python web_demo.py

在这里插入图片描述

保存镜像

这个GPU云服务器的方案是按时间计费的,服务器空闲时间也是计费的,即使关机也不会停止计费。如要停止计费,必须将服务器和云盘都销毁。一旦销毁后,下次还想再使用ChatGLM就只能重复以上繁琐的步骤,至少需要2个小时。
因此,我们可以利用腾讯提供的80G免费快照空间。
当不再需要运行ChatGLM时,可以将当前的服务器和云盘保存为镜像和快照,然后销毁相应资源。
当需要再次使用时,只须在购买设置配置时选择保存的镜像和快照,就可以立刻恢复上次保存的内容。
既省钱又方便,赞!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19210.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Mac 上能跑国产系统了!深度 deepin 官宣:正式适配 M1 芯片

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) Mac 上能跑国产操作系统了,就在今天! 今天上午,深度操作系统(deepin OS)官方宣布:“告诉大家一个令人兴奋的消息:在…

PyTorch Python API详解大全(持续更新ing...)

诸神缄默不语-个人CSDN博文目录 具体内容以官方文档为准。 最早更新时间:2021.4.24 最近更新时间:2023.7.18 文章目录 0. 常用入参及函数统一解释1. torch1.1 Tensors1.1.1 Creation Ops1.1.2 Indexing, Slicing, Joining, Mutating Ops 1.2 Generators…

【GPT4】微软 GPT-4 测试报告(6)与人类的交互能力

欢迎关注【youcans的AGI学习笔记】原创作品,火热更新中 微软 GPT-4 测试报告(1)总体介绍 微软 GPT-4 测试报告(2)多模态与跨学科能力 微软 GPT-4 测试报告(3)编程能力 微软 GPT-4 测试报告&…

你真的会跟ChatGPT聊天吗?(下)

前言:本文下半部分没有无毛猫那么搞笑的内容啦……即使如此,哪怕你对文中提及的技术不大了解,也可毫无压力地看完这篇描述如何更好地获得ChatGPT生成内容的文章。因为我也是利用Azure OpenAI等认知服务来学习,然后就这样写出来的……

猿如意,打开程序的新方式。

软件介绍:猿如意是一款为程序员做开发的开发工具。它里面功能很齐全,各种小工具满足程序开发的很多需求。 用起来这个软件,就像是进入了一套豪华的房子,在开发程序的过程中体会到它的方便,在日常生活中它可以当一位知心…

Myshell AI:让你轻松提高英语口语和听力的神器

推荐:ChatGPT及各种AI网站集合清单!(免费!免费!免费!) 目录 Myshell AI 简介 Myshell的亮点 Myshell注册 总结 Myshell AI 简介 Myshell AI是一个基于chatgpt开发的练口语和听力的神器,它有三款超级酷炫的语音机器人可供选择…

智商狂飙,问了ChatGPT几个数据库问题后,我的眼镜掉了

最近,ChatGPT火爆全网,介绍其产品、公司、作者、技术和应用等方面信息,占据着整个互联网,似乎不谈GPT好像就落伍了。作为一个关注数据库行业的公众号,我们问了GPT几个数据库问题,结果让人大跌眼镜&#xff…

Transformer16 ~Robotics

还是Transformer相关 ,谷歌机器人团队等提出了 Robotics Transformer 1 (RT-1)。这是一种多任务模型,可以 tokenize 机器人的输入和输出动作,从而在运行时实现高效推理,使实时控制成为可能。 论文 1:RT-1: Robotics Transformer …

AIGC潮流下的企业赢家之路

AIGC潮流下的企业赢家之路:〈家猫野猫〉组合成GAN大模型。 很重要的观点:〈其中训练生成型AI最有竟争力的子行业〉。AI建模师的职责:组合模型、训练模型。亦即把一群不会飞的模型巧妙组合起来,训练它然后飞上天际。如果这个创新组…

Can ChatGPT Understand Too?

背景 最近,ChatGPT受到了极大的关注,因为它可以对人类的查询产生流畅和高质量的响应。已有研究表明,ChatGPT与现有模型相比具有显著的生成能力。 动机 ChatGPT理解能力的定量分析却很少受到关注 作者主要做的事 本文通过在最流行的GLUE基…

LSTM模型实战案例:TensorFlow实现预测3位彩票号码

向AI转型的程序员都关注了这个号👇👇👇 大数据挖掘DT机器学习 公众号: datayx 使用人工智能技术来预测彩票,是这次的主题,那么预测哪种彩票呢?我们先选择简单一些的,就是排列组合少…

从风靡全球到风口,Tiktok是如何做到的?

大家好,我是瑞卡迪电子商务。我们是从2019年下半年就注意到了TikTok的风口,并在2020年初,团队就开始投入TikTok的运营及商业变现。从2019年起,围绕TikTok一系列的产品功能迭代和商业模式开放的声音一直不绝于耳,直至今…

tiktok海外版某音,分析协议构造,我们浅谈一下

大家好,我叫任雪飘,今天带大家一起学习一下海外版本的D音,这个大家不陌生吧。 在这之前先强调一下我们中国的网络安全法,一定要准时法理法规。 wss是WebSocket协议的一种通信协议的缩写。wss 和wss不同的是一个采用加密,一个直接…

如何了解(海外抖音TiKToK)与国内抖音的区别以及介绍

一、海外抖音TK平台的优势 自从抖音在中国大受欢迎后,海外也推出了海外版抖音TK平台。尽管两者都是视频分享平台,但它们在一些方面具有明显的区别和独特的优势。下面将详细介绍海外抖音TK平台的优势以及与国内抖音的区别性。 优势: 1. 多元…

常见的TikTok变现方式,你知道几种?

在众多的海外社交媒体中,TikTok以其极具特色的娱乐化短视频,吸引了庞大的用户群体。目前TikTok仍处于发展阶段,竞争压力小、营销效果显著,属于变现的红利期。那么常见的TikTok变现方式,你知道几种呢? 变现方…

跨境人看过来:为什么要使用 TikTok 进行 B2B 营销

每个月,8000 万人平均在 TikTok 上花费 24 小时。这一新机遇彻底改变了 B2C 品牌与客户互动的方式。用于 B2B 营销的 TikTok 能否释放同样的潜力? 相当多的品牌正试图自己回答这个问题。并非所有 B2B 公司都可以利用这些即时#TikTokMadeMeBuyIt B2C 转换…

如何利用ChatGPT打造热门TikTok内容?

TikTok已经成为了全球最流行的短视频平台之一,它每天都有数百万的用户发布和观看视频。 但是,如何在这个平台上发布有吸引力的内容,并吸引更多的粉丝?答案是利用ChatGPT。 ChatGPT是一种基于人工智能的语言模型,可以生…

别等ChatGPT开源了,升级版OPT开源模型来了!

源|新智元 编|Joey 昕朋 今年五月,MetaAI官宣发布了基于1750亿参数的超大模型OPT-175B,还对所有社区免费开放。 12月22日,该模型的更新版本OPT-IML(Open Pre-trained Transformer)正式上线&…

微软发布「升级版」多模态大模型 Kosmos-2!新增局部理解能力,解锁实体级交互

夕小瑶科技说 原创 作者 | 小戏、ZenMoore 三个多月前,微软亚洲研究院在论文《Language Is Not All You Need: Aligning Perception with Language Models》中发布了一个强大的多模态大模型 Kosmos-1,成功将感知与语言对齐,在 ChatGPT 的多…

OpenAI居然能自动写论文?导师直言我都犯难了...

最近两个月以来,刷屏网络技术圈的莫过于chatGPT 莫属了!闲暇之余,自己也去注册了一个账号来看看它的魔力,毕竟也有很多博主抵挡不住其中的诱惑,好吧,我也抵挡不住,也就去开了openAI实验了一番&a…