快捷部署清华大模型 ChatGLM2-6B,一键搞定 HuggingFace Space 空间

“分享一个简单的部署 ChatGLM2-6B 模型到 Huggingface Space 在线空间的方法。

3be54b47ff49b134594b87a317c4c350.png

01

在这篇文章:终于部署成功!GPU 云环境搭建 ChatGLM2-6B 坎坷路中,用线上云算力的资源部署了一套 ChatGLM2-6B,最后显示一行提示:

“This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)”

意思:“这个地址只有72小时,如获得永久的地址,需要运行 gradio deploy 命令来部署到 huggingface 的空间上。

开一个命令终端,试试部署到 Huggingface。‍‍

45b78c56bc6520d4dac0da9ca135c626.png

提示需要登录到 huggingface_hub 的 token。

打开 Hugging Face 网站,点击个人账户的设置部分(Profile)。

323a4000c90bc975beb81ef34ce2ac82.png

找到左边菜单中的“Access Tokens”,然后点击 “New token”。

5cd3a99ffd4bb5b3c148afe6c84131a0.png

截图中我的账号已经创建了好一个 token,见:没有硬件资源?免费使用Colab搭建你自己的Stable Diffiusion在线模型!保姆级教程,这次直接复制使用。

粘贴 token 到终端窗口,对询问“Add token as git credential? (Y/n)” 回复:“Y”,等了一会儿,给了我一闷棍:‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

0c3a05c8727d073c17cb8cbed6434750.png

别看满屏幕的字,有用的信息就两个:“Connection aborted.”,“Connection reset by peer”。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

联想到之前部署的时候,帮助文档里 Huggingface 赫然在列:‍‍‍

af3360b0116d17766456d4f56fa212d7.png

估计是无法直接连接了,怎么办?‍‍‍‍‍

02

想了半天,打开我的腾讯云账号,一咬牙,一跺脚,买了一个月的硅谷云服务器。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

d15efc1380ec8e3fbb5603177a67d347.png

终端登录,git 克隆 ChatGLM2-2B 仓库,然后执行 gradio deploy 命令。 

出乎我的意外,居然也是同样的连接错误。看来虽然服务器地址不一样,还是执行了同样的网络策略。哭!

部署看起来简单,虽然只有一行命令,但是因为网络的连接问题,进展陷入了死胡同。

问问 ChatGLM,有没有什么好的解决方案。‍‍

0a49db360b8fbdb5e46e78f73cffc29e.png

看起来正确,感觉 ChatGLM2-6B 还真是不弱。国产之光,ChatGPT 国内产品的平替真不是白叫的。感兴趣的朋友,可以看 ChatGLM2-6B 初体验。

最后想到,既然是执行发布命令,连接到 Huggingface Space 空间去操作,其实把仓库克隆到本地电脑(有代理),再执行发布命令,是不是一样可行?‍‍‍‍‍‍‍

d77d34632a47fb716601425180e42f5a.png

这个方案成功了,命令行下执行完 git 克隆命令,输入 token 之后,顺利进入下一步。部署命令 “gradio deploy” 会在 Huggingface 上创建一个你的仓库空间:‍‍‍‍‍‍‍‍‍

Creating new Spaces Repo in '/Users/huangyong/Documents/ChatGLM2-6B'

请记住,在回答后续问题时,除了硬件配置以外,其他都可以回车采用默认值。‍‍‍‍‍

Enter Spaces hardware (cpu-basic, cpu-upgrade, t4-small, t4-medium, a10g-small, a10g-large, a100-large) [cpu-basic]: 
‍‍‍‍‍‍‍

这个地方输入:t4-medium,才能让 ChatGLM2-6B 跑起来。‍‍‍‍‍‍

(看 ChatGLM-6B 官方文档有量化模型的设置,猜测可以让更少的硬件也能运行起来,我没仔细研究。)

第一次运行的时候,就按了回车,选择默认 cpu-basic 硬件配置,就没运行起来。‍

如果直接输入:t4-medium,会提示需要添加一个付款方式:You must add a payment method to your account 。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

e4958d411e9302f9f55206df7f6a8ce2.png

当时我没关注这条提示信息,直接用基本配置 cpu-basic 部署,结果就是失败。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

a8c66e6833c9500e9286e520799ed8da.png

RuntimeError:Found no NVIDIA driver。

如果硬件配置选择 t4-small,会卡在第5个 Checkpoint。‍‍‍‍‍

f284fa3eead3429d8cab525019e2bccc.png

没有任何错误提示,也是卡这里郁闷了很久。也不报错,最后猜测是不是硬件资源里面内存不够,把空间升级到 medium,就能顺利运行起来了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

44bca9d5aaf3f4e4c50f4de714fe4356.png

启动后,点右上角:“App”。


8fcad6020ffee3af0cf43c7e8993ee41.png

Huggingface Space 提供一个永久的空间地址供访问:

https://huggingface.co/spaces/foghuang/ChatGLM2-6B。

Space 上面还有很多好玩的,使用人工智能模型的应用,大家有兴趣可以点开试用。像下面的第一个就是文本和语音互转的应用。‍‍‍‍‍‍‍‍‍‍‍‍

https://huggingface.co/spaces

86b50784fc69006977a54b0e9093443f.png

03

Huggingface Space 部署总结:‍‍‍‍‍

  1. HF 注册账号;‍‍‍‍‍‍‍‍‍

  2. 添加 token;

  3. 添加支付方式,国内借记卡,信用卡均可;

  4. 能访问 HF 的环境;

  5. 默认情况下,硬件最小配置选择: t4-medium;

  6. 启动成功后,点 space 的 App,可以看到运行界面;

  7. HF 提供永久地址,可以让应用被外部用户访问。

往期热门文章推荐:

ChatGLM2-6B 初体验

性能提升571%,32K超长上下文,推理速度提升42%,允许商用,国产开源大模型推出了二代 ChatGLM2-6B

不允许还有人不知道可以免费用 ChatGPT 的网站,ChatGPT3 和 4,Claude 和 Claude+ 一网打尽

没有硬件资源?免费使用Colab搭建你自己的Stable Diffiusion在线模型!保姆级教程

拥抱未来,学习 AI 技能!关注我,免费领取 AI 学习资源。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/50908.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何真正“不花一分钱”部署一个属于你的大模型

前言 看了那么多chatGPT的文章,作为一名不精通算法的开发,也对大模型心痒痒。但想要部署自己的大模型,且不说没有算法相关的经验了,光是大模型占用的算力资源,手头的个人电脑其实也很难独立部署。就算使用算法压缩后的…

Stable-Diffusion AI画画本地搭建详细步骤

ChatGPT出来后,第一次感觉到人工智能真的可能要来了,因此也顺便尝试了下开源AI画画的搭建。网络上写的教程总是不那么面面俱到,因此本文参考了3篇文章才成功把Stable-Diffusion 本地搭建搭建了起来。参考教程在文末。 本文是本地搭建AI画画&a…

记录关于GPT的应用

一.AutoGPT chatgpt是一问一答的形式,autogpt则是输入需要做的东西以及几个目标,例如: Enter y to authorise command, y -N to run N continuous commands, n to exit program, or enter feedback for .. 注意:openai账户里应该…

[大模型] LLaMA系列大模型调研与整理-llama/alpaca/lora(部分)

文章目录 LLaMA大模型及其衍生模型1. LLaMA2. stanford_alpaca3. ChatDoctor4. alpaca-lora5. Chinese-LLaMA-Alpaca6. BELLE 大模型综述 A Survey of Large Language Models 关键词:大模型,LLaMA,Alpaca,Lora,Belle&a…

国内优秀的开源低代码框架:PagePlug,面向研发使用,拒绝重复、低价值的工单循环开发

分享下Appsmith中文版的PagePlug吧,面向研发人员使用的低代码: PagePlug将开发人员的开发时间减少了 60%,PP框架本身解决了很多没必要的繁重工作。 前者appsmith目前是github上超27K最火的开源低代码平台,后者PagePlug也是目前国内…

使用cookie保存用户的登录状态——初步实现

保存用户的登录状态是许多网站都会使用,一般会使用session、数据库或者cookie和session相结合的办法,这里我们了解 cookie的方法来保存用户登录状态. Cookie 是在 HTTP 协议下,服务器或脚本可以维护客户工作站上信息的一种方式。Cookie 是由 Web 服务器保存在用户浏…

解决Ubuntu的root账号无法登录SSH问题-Permission denied, please try again.

有时,我们登录SSH的时候,会出现如下问题: 此时,是因为系统默认禁止root用户登录ssh,此时我们可以这样解决: 首先,CtrlC退出密码输入界面: 然后输入:su - tips&#xff1a…

chatgpt赋能Python-pythonwxpy

Python的wxpy模块:一款强大的微信机器人框架 在当今数字时代,微信已经成为了大家日常生活中不可缺少的应用。wxpy是一款使用Python语言的微信机器人框架,可以帮助用户实现诸如自动回复、消息提醒、定时发送消息等自动化操作。它的易用性、强…

马云获聘港大荣誉教授/ 马斯克回应星舰发射架损坏/ 谷歌Bard更新...今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是4月23日星期日,调休的周末心情belike: 今天科技圈有哪些新鲜事儿,和日报君一起来看看~ 星舰发射架损坏,马斯克回应 据华盛顿邮报报道,SpaceX发射星…

巴比特 | 元宇宙每日必读:游戏是AIGC应用的首选场景?游戏厂商如何利用AIGC提升产能?...

摘要:据手游矩阵报道,作为科技含量最高的创作领域,游戏行业对AI的利用根本无需等到ChatGPT这样的风口,而是早就已经在跑步入场了。国内厂商更多是将AI定位为效率工具,而非炒作手段。游戏厂商无论大小,只要手…

企划案与GPT4ALL

企划案与GPT4ALL 近日,需要写一份服装店的企划方案 疫情已经彻底过去,告别三年来的经营上面的负面因素。各行各业也正在如火如荼地争取最快的速度恢复生意。因为我所经营的服装店近来需要做一个2024年的企划方案,所以在最近GPT4ALL很火的情…

五月到了,再来看看ChatGPT给我们带来了什么吧!

ChatGPT,即聊天生成预训练转换器(Chat Generative Pre-trained Transformer),是美国OpenAI公司基于GPT-3.5架构(目前已经更新到GPT-4,但仅限于Plus用户)研发和强化训练的一款人工智能聊天机器人…

招聘网站数据分析岗位数据分析(Excel实现)

数据分析案例 明确分析的目的数据处理原始数据数据清洗选择子集重复数据处理 缺失数据处理数据转化数据提取-字段分割异常值处理 数据分析1.需求在哪里?2.需要什么样的人才?3.什么阶段需求最旺? 结论 明确分析的目的 • Where——需求在哪里…

某招聘网站“数据分析”相关岗位招聘信息爬取并分析

确定目标 简单分析数据分析相关岗位的薪酬状况及技能要求;尝试数据分析从数据获取到数据分析报告撰写的整个数据分析流程,学习爬虫、数据清洗、数据分析相关技巧。 数据获取 获取的岗位数据来源于某招聘网站,采取爬虫的方式获取,岗位搜索…

OGG-01028分析处理

1.现象 ogg的安装目录使用率达到100%,果断时间会释放短时间又会达到使用率100%。 2.分析 2.1 如果是队列文件问题不应该自己释放短时间又达到100%,查看到底是哪个目录导致。 du -sm /home/oracle/oggsource/*|sort -n 83 replicat 277 dir…

医药行业数据分析软件(含非付费)--对比分析

目前主要使用的医药数据软件分为两大类,一个是免费医药数据软件,一个是商业综合类的医药数据软件。医药数据软件的本质是让用户能在最短时间内在一个网站把想要的信息通过检索一览无余,因此,全面性、准确性、及时性是该类数据库的…

医药行业的销售数据如何分析?

本文转自公众号叨叨侠爱叨叨 ▌一、医药行业的体系 医疗属于大健康行业,大健康(Healthcare Industry)行业一般是指经济体系中向患者提供预防、治疗、康复等服务部门的总和,更接近于我国的医疗卫生服务业。 按照国际行业分类标准来…

医药产品经理ims数据分析

如果说某个药品的销售额在对比去年同月下降40%,而你身为该药品的产品经理是否能快速找出其原因?这是医药产品经理、医药市场bd对于数据异动分析的考题,侧面反映了医药行业数据分析对于医药产品经理这个职位的重要性。 说到医药行业数据分析先…

数据分析案例-大数据相关招聘岗位可视化分析

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

医药销售数据分析

阅读原文 一、数据源 来自某医药公司的产品销售数据,时间为 3 月到 5 月,共 48 个 Excel 表格。包含订单信息、售后信息、用户信息以及对应销售人员信息等。 加载合并后得到的原始数据如下: 二、数据清洗 清洗流程以及对应细节 加载数据源 …