聊聊ChatGLM-6B部署与微调的深入理解

聊聊ChatGLM-6B部署与微调的深入理解

news/2024/12/26 12:05:46/文章来源:https://blog.csdn.net/2401_85327249/article/details/140852599

前言

ChatGLM的部署，主要是两个步骤：

在Github上下载chatglm的库文件
在Hugging Face上下载模型参数与配置文件

ChatGLM包

从Github上看ChatGLM项目文件的结构来看，仅仅是包含三种部署方式的py代码与微调的py代码

而相关的实现细节，比如神经网络、激活函数、损失函数等具体的实现，并不在该项目源码中。
不管以哪种方式部署，最核心就是三句代码，其作用是引入模型参数，初始化transformers配置；以web部署的方式为例：

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
model = model.eval()// 引入Gradio，实现web方式的使用// 调用模型方法，开始进行对话推理
xx = model.stream_chat(xxxx);

web的调用是基于Gradio；
api的调用是基于fastapi；
cli的调用是基于python解释器；

Hugging Face

Hugging Face平台的模型库如下：

除去与训练后的模型参数(xxx.bin)外，其余的文件是huggingface的文件结构。

微调

微调的解决方案一般是P-Tuning或LoRA；ChatGLM-6B是基于P-Tuning v2实现的微调，P-Tuning v2是基于连续提示(continuous prompts)的思想。微调会生成新的模型参数文件，也称为checkpoint文件。
微调时可以选择全参数微调或是部分参数微调，其流程是训练+推理。训练生成新的checkpoint文件(模型参数)；推理则是加载模型参数文件。
训练前，需要调整参数，一般修改train.sh脚本文件就行。
推理时，加载原模型文件与微调后生成的checkpoint文件。还是通过那三句代码。
输出的checkpoint文件如下：

checkpoint文件夹内的文件如下：

transformers的联系

目前的模型，都会对接到Hugging Face平台的transformers库中，通过transformers库来管控大模型。所以在推理阶段通过三句代码就能调用AI模型。在微调阶段，生成的checkpoint文件中，其结构是Hugging Face平台的文件结构，包含transformers的相关配置及初始化信息。

总结

最后

感谢你们的阅读和喜欢，我收藏了很多技术干货，可以共享给喜欢我文章的朋友们，如果你肯花时间沉下心去学习，它们一定能帮到你。

因为这个行业不同于其他行业，知识体系实在是过于庞大，知识更新也非常快。作为一个普通人，无法全部学完，所以我们在提升技术的时候，首先需要明确一个目标，然后制定好完整的计划，同时找到好的学习方法，这样才能更快的提升自己。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

五、面试资料

我们学习AI大模型必然是想找到高薪的工作，下面这些面试题都是总结当前最新、最热、最高频的面试题，并且每道题都有详细的答案，面试前刷完这套面试题资料，小小offer，不在话下。
在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/388579.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

黑马JavaWeb后端案例开发（包含所有知识点！！！）

黑马JavaWeb后端案例开发（包含所有知识点！！！）

目录 1.准备工作环境搭建开发规范 REST（REpresentation State Transfer）,表述性状态转换，它是一种软件架构风格注意事项统一响应结果 2.部门管理功能查询部门删除部门新增部门 RequestMapping 3.员工管理功能分页查询批…

阅读更多...

Android 10.0 Launcher 启动流程

Android 10.0 Launcher 启动流程

在前面SystemUI启动流程中说到，在SystemServer中会去启动各种系统服务，这里的launcher也是启动的其中一个服务ActivityManagerService去启动的。在android10之前，系统四大组件的启动都是在ActivityManagerService中，在android10中…

阅读更多...

最短路问题中的朴素版Dijkstra算法

最短路问题中的朴素版Dijkstra算法

最短路问题的朴素版Dijkstra算法题目最短路问题需要用到下面的算法（n代表点的数量，m代表边的数量） 朴素版和堆优化版的Dijkstra算法的区别是，朴素版比较适合稠密图，堆优化版适合稀疏图，稠密图代表它的边…

阅读更多...

python | TypeError: list indices must be integers or slices, not tuple

python | TypeError: list indices must be integers or slices, not tuple

python | TypeError: list indices must be integers or slices, not tuple 在Python编程中，TypeError: list indices must be integers or slices, not tuple 是一个常见的错误。此错误通常发生在尝试使用非整数（如元组）作为列表索引时。本…

阅读更多...

RK3568笔记四十九：W25Q64驱动开发（硬件SPI1)

RK3568笔记四十九：W25Q64驱动开发（硬件SPI1)

若该文为原创文章，转载请注明原文出处。一、SPI介绍串行外设接口 (Serial Peripheral interface) 简称 SPI，是一种高速的，全双工，同步的通信总线，并且在芯片的管脚上只占用四根线，节约了芯片的管脚。 …

阅读更多...

Python写UI自动化--playwright(在UI元素上悬停)

Python写UI自动化--playwright(在UI元素上悬停)

要在UI元素上执行鼠标悬停（hover）动作，可以使用page.hover()方法。这个方法使鼠标指针移动到指定的元素上，就像用户将鼠标悬停在该元素上一样。这对于触发那些依赖于鼠标悬停事件的行为（如显示下拉菜单、提示框或其他动…

阅读更多...

[极客大挑战 2019]PHP1

[极客大挑战 2019]PHP1

打开题目游戏界面猜测php里面有文件，我们可以用dirsearch 扫描一下这个服务器执行命令 dirsearch -u http://2999dfd5-1d43-4a81-a088-9e41c9dccab4.node4.buuoj.cn/ -e php > test.log 最后在log文件中找到一个 200 www.zip 浏览器输入payload下载下来 …

阅读更多...

操作系统_内存管理学习心得

操作系统_内存管理学习心得

1. 操作系统结构 1.1 内核计算机是由各种外部硬件设备组成的,比如内存、cpu、硬盘等,如果每个应用都要和这些硬件设备对接通信协议，那这样太累了，所以这个中间人就由内核来负责,让内核作为应用连接硬件设备的桥梁,应用程序只需关心与内核交写&#x…

阅读更多...

C++ | Leetcode C++题解之第283题移动零

C++ | Leetcode C++题解之第283题移动零

题目： 题解： class Solution { public:void moveZeroes(vector<int>& nums) {int n nums.size(), left 0, right 0;while (right < n) {if (nums[right]) {swap(nums[left], nums[right]);left;}right;}} };

阅读更多...

SpringBoot集成GraalVM创建高性能原生镜像

SpringBoot集成GraalVM创建高性能原生镜像

1. GraalVM 原生镜像的介绍 GraalVM原生镜像为部署和运行Java应用程序提供了一种新的方式。与Java虚拟机相比，原生镜像可以以更小的内存占用和更快的启动时间运行。它们非常适用于使用容器镜像部署的应用程序，当与 "功能即服务"&#xff08…

阅读更多...

短剧系统源码分享，快速搭建部署上线教程

短剧系统源码分享，快速搭建部署上线教程

一、短剧系统是什么？ 短剧制作平台，作为一站式综合解决方案，集剧本创作、角色设计、场景搭建、视频编辑、便捷发布及深度数据分析能力于一身。该平台精准定位于助力企业利用短剧形式强化品牌传播力并驱动商业价值增长，无论企业是…

阅读更多...

什么是IO多路复用？其原理和用途是什么？

什么是IO多路复用？其原理和用途是什么？

什么是IO？ IO：Input/Output，即数据的读取（接收）/写入（发送）操作，针对不同的数据存储媒介，大致可以分为网络 IO 和磁盘 IO 两种。在 Linux 系统中，为了保证系…

阅读更多...

关于Excel表格隔行取列的方法

关于Excel表格隔行取列的方法

关于Excel表格隔行取列的方法 1、场景显示2、参考文章 1、场景显示 ①处的公式： INDEX($B3:$G3,(COLUMN(A1)*2)) $B与$G可以限制列不变； COLUMN(A1)返回1； 含义： 在选定区域选择偶数列的数据； 如果是奇数列的话是(COL…

阅读更多...

查看RAM和Flash

查看RAM和Flash

0 Preface/Foreword 1 查看方法 1.1 map文件中查看 1.1.1 RAM可用情况在map文件中，搜索字符串：free_ramcp 该字段表示剩余可用的RAM大小，前面对应的是hexadecimal的数值（单位Byte），就是剩余可用的RA…

阅读更多...

乱弹篇（39）请珍惜懂你的人

乱弹篇（39）请珍惜懂你的人

今日清晨，笔者照常去到古镇味江河畔垂钓，呼吸着凉爽晨风轻轻吹拂而来的大自然氧吧生产出的优质氧气......忽地，记起已经许久未履行义务了，所以本“人民体验官”今天要推广人民日报官方微博文化产品《有个真朋友是一生的福气》。截…

阅读更多...

Redis：十大数据类型

Redis：十大数据类型

键（key） 常用命令 1. 字符串（String） 1.1 基本命令 set key value 如下：设置kv键值对，存货时长为30秒 get key mset key value [key value ...]mget key [key ...] 同时设置或者获取多个键值对 getrange…

阅读更多...

实验21.实现 printf

实验21.实现 printf

已完成实验已完成实验链接简介实验 21. 实现 printf 总结简化系统调用和中断，用 eax 代表调用号参数，ebx,ecx,edx 来代表参数(syscall.c kernel.s) 添加 write 的系统调用接口(syscall.c, syscall-init.c, print.s) 注意：要更改 p…

阅读更多...

基于N32L406MB EasyFlash参数（key-value）记录库移植

基于N32L406MB EasyFlash参数（key-value）记录库移植

EasyFlash 感谢作者的分享https://github.com/armink/EasyFlash EasyFlash是一款开源的轻量级嵌入式Flash存储器库，方便开发者更加轻松的实现基于Flash存储器的常见应用开发三大实用功能 ENV快速保存产品参数(key-value)，支持写平衡（磨…

阅读更多...

最小例程上加OLED显示

最小例程上加OLED显示

最小例程上加OLED显示本工程代码链接: https://ww0.lanzoul.com/i8lNa265gj7g 失效联系:qq2958360390 我们其实就加上这几个文件, 然后会调用就可以了, 具体的就看江协科技的OLED, 讲的很清楚, 我们这里只说应用, 我们的重点在使用. 下面跟着我来, 复制黏贴: 更详细请看哔哩…

阅读更多...

从零开始学习机器学习，掌握AI未来的关键！

从零开始学习机器学习，掌握AI未来的关键！

从零开始学习机器学习 1. 介绍1.1 人工智能（AI）概述1.2 机器学习在人工智能中的应用1.3 机器学习基础概念 2. 监督学习2.1 什么是监督学习2.2 回归分析2.3 分类问题2.4 模型评估和选择 3. 无监督学习3.1 什么是无监督学习3.2 聚类算法3.3 降维技术 4. 深…

阅读更多...

最新文章

推荐文章