工程落地实践|国产大模型 ChatGLM2-6B 阿里云上部署成功

 之前尝试过在各种不同的云平台、云算力,部署清华大模型 ChatGLM2-6B,有失败有成功,但不是很理想。这次使用免费的阿里云机器学习GPU资源,终于成功了。

b08f62e099349710e1a3818d038a6fe3.png

01

本来以为今天的部署又要失败,却获得意外之喜,赶紧上来给朋友分享,同时记录一下过程。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

之前的部署经历:

快捷部署清华大模型 ChatGLM2-6B,一键搞定 HuggingFace Space 空间‍‍‍‍‍‍‍‍

终于部署成功!GPU 云环境搭建 ChatGLM2-6B 坎坷路

这次有朋友介绍阿里云也有机器学习PAI,其中交互式建模DSW,可以用来部署自己的模型和数据集。‍‍‍‍

先分享免费使用国产大模型 ChatGLM2-6B 对话的地址:‍‍‍

https://0b6b7c84-16c7-469c.gradio.live/

在服务器上面命令行测试模型对话:‍‍‍‍‍‍‍

dbd2884300299b1f97a87908514fc358.png

Web 服务对话界面:‍‍‍‍‍‍

04cc63295ccb408227cf4698fa8338a1.png

02

实践过程‍

  1. 腾讯云部署失败。未找到相关的大模型的部署教程,从ECS云服务器的基础上开始部署,遇到很多大模型所需要的开发框架所需要的组件、资源的问题,坑无数,被折磨两天后,放弃了。 


  2. AutoDL AI算力云成功部署。优点:有成熟的大模型 docker 镜像,有可访问的huggingface 镜像站,下载模型的数据集和权重方便。缺点:收费-按小时收费,GPU 资源 RTX A5000 (0/1040) 收费 1.13元/小时,一个月大约813元,费用不低。


  3. Hugging face 的 space 成功部署。优点:有成熟的大模型 docker 镜像,本身提供空间可发布 Web 网站,以便用户访问。缺点:国内访问困难,也是 GPU 资源收费。


  4. 早些时候,试过阿里云部署,因为无法访问放在 Hugging face 上的数据和权重。提过工单询问,就是国内的国情使然,而且没有国内镜像站,建议下载后再上传到服务器。


    这次实在没有选择了,自古华山一条路,迄今黄河百汇成。

    再试试能不能解决模型和权重文件的问题。

  5. 从 Hugging face 下载七个1个多G的模型文件,和其他必要的文件。再从控制台上传到机器学习的空间上,总是失败,文件太大了。


  6. 再试方案:下载到本地,再上传到 Github - 因为阿里云可以访问。结果告知,上传 Github 超过100M的文件需要使用 Git-lfs (Large File Storge,即大文件存储),而且限制最多存储 1G 空间。这思路不行。‍‍


  7. 阿里技术支持小哥说用 OSS(Object Storage Service,对象存储服务),把文件传到 OSS 上。之后可以用两种方法来访问 oss 的文件:1. 在程序中添加读取 oss 上文件的代码;2. 用 ossutils 下载文件到机器学习的服务器空间。


  8. 那就开动吧,开通 OSS 对象存储服务,再上传模型权重文件到OSS。


  9. 根据帮助教程,安装 ossutils,生成账号的访问权限 key,填到 ossutils 配置中,再拷贝刚才上传文件。这过程遇到两个坑:

    ‍1. key 不对,解决这个问题我就直接使用了全局的账号。

    ‍2. 拷贝时的链接地址不能用 oss 控制台界面的https 地址,问了支持小哥,需要用 oss:// 协议地址。


  10. 最后总算是大功告成。使用地址:

    ‍https://0b6b7c84-16c7-469c.gradio.live/


  11. 安装完之后,才发现国内清华云盘上有模型权重文件,地址见下方资源部分。如果能早点知道国内的地址,也许就可以直接从服务器上下载这几个大文件,不用上面折腾这么一大圈了。


  12. 阿里云的 GPU 目前免费提供三个月的试用。

03

相关教程、资源

【官方教程】‍‍‍‍‍

ChatGLM2-6B 部署与微调

https://www.bilibili.com/video/BV1D94y1i7Qp

视频中的 PPT 文件下载:

链接: https://pan.baidu.com/s/1T5vBCAPG2ahrI_H2jKnihw?pwd=mwmr 提取码: mwmr 

ChatGLM 的 Prompt 工程实践,真实案例详解

https://www.bilibili.com/video/BV1ic411c7gE

ChatGLM 模型权重清华云盘地址(全版本)

https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/

04

专家知识库

预告:在成功部署 ChatGPT 模型的基础上,用咱们国产的大模型 ChatGLM ,以及 LangChain 开源框架(围绕大语言模型构建的框架,可用于聊天机器人、生成式问答 (GQA)、摘要等)搭建“个人专属知识库”。

您可以上传自己感兴趣的文章、资料到这个知识库中。之后,大模型就可以根据这些个人资料,利用其强大的推理能力,回答您提出的相关问题。

例如:收集某位喜欢的公众号或博主的文章,上传到自己的知识库。当您对这些内容有任何疑问时,知识库就可以为您提供解答。这就像拥有一个私人的、基于自身兴趣的问答专家!‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

还有更多可发掘的场景,希望这个新产品可以帮助朋友们获取更加个性化的知识服务。

往期热门文章推荐:

Claude 2 解读 ChatGPT 4 的技术秘密:细节:参数数量、架构、基础设施、训练数据集、成本

AI人工智能大模型失守!ChatGPT、BARD、BING、Claude 相继被"提示攻击"攻陷!

定制化需求|一个人工智能大模型应用的算力成本有多高?

为什么对ChatGPT、ChatGLM这样的大语言模型说“你是某某领域专家”,它的回答会有效得多?(二)

拥抱未来,学习 AI 技能!关注我,免费领取 AI 学习资源。

最近关注人工智能项目落地的朋友越来越多,考虑到问的各种问题,我联合了两位大咖:右军、海煌,共同开发设计了:《AI启航实用变现手册》,提供各类AI工具使用教程及变现方法和路径。

目前也在积极筹备知识星球的建设,以及赠送给会员的福利AI产品:不用魔法,体验AI 智能聊天,AI 绘画,保证学会工具的使用后,可以上手实际操作。

我们的目标解决朋友们 AI 学习中的四个核心问题:信息差,认知差,执行差,人脉差。

手册初稿含两方面的内容:一、如何利用AI去提升效率;二、用AI变现指南。

ab6bf0f4c97b2d4260605dabc3e7e2a5.png

变现部分是实际实打实的操作记录和赚钱过程拆解,初版就共15万字,内容将来还会持续更新,将来还会带领朋友们进行实际的操作。

下面是抖音的一个视频,上线两天,23.8万的播放。

3b16a53a500df791cace70f03f3e9a44.jpeg

手册涵盖了目前市面上最全、最新的教程,价值 ¥199 元,

现开始阶段优惠, ¥39.9元。3天内不满意,可以无条件退款。后面随内容更新和销售增加,逐步恢复原价。

有朋友问:学了AI能做什么?

1、市场营销人/广告人:打造爆款文案/广告语、Slogan创作/ldea发想提升脑爆效率/自动生成ppt。

2、公务员/公共关系/公关公司:迅速撰写公关稿/万字政府工作报告/标准格式文本出品/宏观大格局文案生成。

3、学生/初入职场:如何准备面试/学英语不用花钱了/免费口语老师论文生成/查重、查错别字/学习各种奇怪的知识。

4、自媒体人/知识博主/KOL:自动生成视频脚本/自动生成影评小红书笔记高效创作/高效写知平/写小说神器。

5、老板/企业高管:创新商业决策/前沿资讯获取/免费小助理低成本功能模块开发/朋友圈人设打造。

喜欢手册的朋友,也可以推荐给周围的朋友,手册设置了分销比例45%,推荐两册,就相当于白得手册。

点下面👇二维码,长按识别。

b3f334aa02eafd5e38909288c53ef7dd.jpeg

买了手册的朋友,务必加我微信 foghuang(好些朋友直接下单,没加我微信),拉你进手册售后交流群。

点击👇 “原文链接”,可以使用 ChatGLM2-6B 来对话。‍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8659.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深度解读字节跳动开源的云原生数据仓库 ByConity

ByConity 基于 ClickHouse 内核开发,采用计算存储分离的架构、主流的 OLAP 引擎和自研的表引擎,提供便捷的弹性扩缩容和极速的分析性能,覆盖实时分析和海量数据的离线分析,帮助企业更好地挖掘数据价值。 责编 | 夏萌 出品 | CSDN&…

《吃豆人》问世 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 5 月 22 日,在 1994 年的今天,知名中文论坛曙光 BBS 站开通。1994 年 4 月 20 日,建立在中科院和北京大学、清华大学之间的中…

Java 之父诞生 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 5 月 19 日,在 1999 年的今天,分布式计算项目 SETIhome 正式向公众发布。SETIhome 是一个通过网际网路利用个人电脑处理天文数据的分布式…

纵览2023世界人工智能大会:百模大战4个月,中国AI产业怎么样了?

文|刘雨琦,编|王一粟 身处大模型的浪潮之中,AI的热度一波接着一波。 7月6日,2023年世界人工智能大会在上海召开,一度冲上了微博热搜榜。在5万平方米的会场中,400多家企业的展台员工都在不遗余…

2023中国费控报销领域最具商业合作价值企业盘点

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 在企业的日常运营中,控制费用是非常重要的一项任务。一个高效且经济稳健的企业,必然需要严格掌控各项支出。其中,报销费控更是企业控制费用的重要手段。 根据灼识咨询发布的白皮书&#x…

超强版干货投递!Milvus 的部署心得、运维秘籍都在这里了!

好奇 Milvus 读链路的演进?不知如何优化 Milvus?提到 Milvus 的业务场景只能靠想象?想获得其他人的部署经验?困惑于 Zilliz Cloud? 不藏了,摊牌了,对于上述的所有问题,你都可以在今天…

科研办公学习的开源免费神器汇总

科研办公学习的开源免费神器汇总 一.公式: 1.Mathtype 是一款专业的数学公式编辑工具,理科生专用的工具。mathtype公式编辑器能够帮助用户在各种文档中插入复杂的数学公式和符号。 2.Mathpix Mathpix可以将图片、PDF 文档、网页中,甚至是手写的数学…

斯坦福大学团队提出AI生成文本检测器DetectGPT,通过文本对数概率的曲率进行可解释判断

原文链接:https://www.techbeat.net/article-info?id4583 作者:seven_ 随着以ChatGPT等大型语言模型(large language models,LLMs)的爆火,学界和工业界目前已经开始重视这些模型的安全性,由于C…

张勇发全员信:阿里云将分拆上市;ChatGPT官方iOS应用上线,支持中文语音;Bun 0.6发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

搭建Gpt OpenAI 人工智能写作助手和内容创SaaS系统

该源码是一个SaaS平台,允许你的用户使用OpenAI人工智能技术来生成独特的内容和图像。它可以生成新的无抄袭内容,并以多种语言改进现有内容。用户还可以通过OpenAI DALL-E和稳定扩散,通过描述图像来生成图像。用户还可以通过OpenAi Whisper模型…

建议熟知:2023谷歌新搜索规则!

谷歌作为全球最大的搜索引擎之一,不断更新和调整其搜索算法和规则,以提供更精准、高质量的搜索结果。2023年,谷歌搜索将迎来一系列新的搜索规则,同时,AI工具的快速发展也为谷歌搜索带来了全新的应用场景和可能性。 这…

马云创办的「中国黄页」上线 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 5 月 9 日,在 1993 年的今天,第一届东亚运动会在上海隆重开幕,这是亚洲体育运动史上的新篇章。来自东亚地区的中国、日本、中…

迎战ChatGPT风口 | 冰山数据发布多轮对话标注系统

近期,科技领域最火爆的话题无疑是由OpenAI推出的ChatGPT,通过ChatGPT可以帮助个人用户和企业生成文章、撰写视频脚本、写小说、写诗歌、谱曲、解答各种专业问题、甚至可以解答数学问题和写代码。 谷歌、百度、苹果等科技和互联网巨头也在该领域进行跟进&…

ChatGPT Plus使用指南:解锁人工智能模型的强大功能

引言: 想要利用世界上最先进的AI语言模型优化您的工作任务吗?OpenAI的ChatGPT Plus正是您的理想选择。本篇博客将为您介绍ChatGPT Plus,并展示其友好的用户界面。 一、ChatGPT Plus的使用步骤 1、访问ChatGPT官方网站 登录ChatGPT&#xff0c…

基于深度学习股票预测系统

摘要 股票市场的发展对于市场经济具有重要的意义,许多研究者也对股票市场的走势进行预测研究。通过一些技术来预测股票未来的发展趋势,预测其后面涨跌。股票指数是预判经济的一个重要指标,股票指数表示的就是股票市场中总体的发展水平和走向…

如何借助现有股票量化交易平台编写策略和回测分析

每个交易日的股票都会上涨或者下跌,在这个过程中笔者们偶尔会想针对部分股票进行股价的涨跌幅进行监控,或者自动进行交易,在这个需求前提下,现有券商、股票分析软件都会带有机器人自动交易策略功能,大部分都需要收费或…

Tushare简单股票预测,仅用于交流学习

第一次做Tushare简单股票预测,仅用于交流学习,若有错误欢迎批评指正 下面是用Tushare进行中石化的股票预测 import tushare as ts import pandas as pd import keras from keras import layers from keras import models from keras import Sequential from keras.…

是涨是跌?用Python预测股票价格趋势

来源数据:STUDIO,作者:云朵君 导读:在本文中我们尝试研究白酒股票市场的数据。使用baostock来获取股票信息,可视化它们的不同,最后将使用一些方法来分析股票的风险。还将通过长期短期记忆(LSTM)方法来预测未…

股票分析,利用线性回归实时预测股价,只需要提供股票代码即可爬取相应股票数据并建模

这里参考了别人的代码,并引用了tushare模块中定义的接口自动获取了依据 股票代码来获取数据 此篇文章提供了 1.一个简单通过接口爬取csv数据的方法 2.一个处理csv数据的简单方法 3.依据数据进行特征提取建立简单的股价预测模型 如下: 使用的话只需要修改…

大幅提升预测性能,将NSTransformer用于股价预测

写在前面 NSTransformer模型来自NIPS 2022的一篇paper《Non-stationary Transformers: Exploring the Stationarity in Time Series Forecasting》。NSTransformer的目的主要是为了解决其他方法出现过平稳化处理的问题。其通过提出序列平稳化以及去平稳化注意力机制可以使得模型…