[算法前沿]--059-大语言模型Fine-tuning踩坑经验之谈

[算法前沿]--059-大语言模型Fine-tuning踩坑经验之谈

news/2024/12/24 1:50:16/文章来源:https://blog.csdn.net/weixin_32393347/article/details/136077711

前言

由于 ChatGPT 和 GPT4 兴起，如何让人人都用上这种大模型，是目前 AI 领域最活跃的事情。当下开源的 LLM（Large language model）非常多，可谓是百模大战。面对诸多开源本地模型，根据自己的需求，选择适合自己的基座模型和参数量很重要。选择完后需要对训练数据进行预处理，往往这一步就难住很多同学，无从下手，更别说 training。

然后再对模型进行 finetuning 来更好满足自己的下游任务。那么对于如果要训练一个专家模型。预训练也是必不可缺的工作。不管是预训练还是 finetuning（微调），无论选用何种方案，都避免不了训练中产生的灾难性遗忘问题，那么怎么减少和避免这种情况的发生，也是本文想讲的一个重点。对于推理，在 GPU 资源不富裕的情况，如何最小化的利用内存，提升推理效率，也是可以讨论的内容。

模型选择

先看一下最好的模型有哪些，以下数据是最新 LLM 排行，来自 UC 伯克利 [1]

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/253628.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

MySQL篇----第十四篇

MySQL篇----第十四篇

系列文章目录文章目录系列文章目录前言一、MySQL 数据库作发布系统的存储，一天五万条以上的增量，预计运维三年,怎么优化？二、锁的优化策略三、索引的底层实现原理和优化四、什么情况下设置了索引但无法使用前言前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽…

阅读更多...

BGP协议

BGP协议

1.BGP相关概念 1.1 BGP的起源不同自治系统（路由域）间路由交换与管理的需求推动了EGP的发展，但是EGP的算法简单，无法选路，从而被BGP取代。自治系统：（AS） IGP：自治系统…

阅读更多...

【Linux】gdb调试与make/makefile工具

【Linux】gdb调试与make/makefile工具

目录导读 1. make/Makefile 1.1 引入 1.2 概念 1.3 语法规则 1.4 示例 2. Linux调试器-gdb 2.1 引入 2.2 概念 2.3 使用导读我们在上次讲了Linux编辑器gcc\g的使用，今天我们就来进一步的学习如何调试，以及makefile这个强大的工具。 1. mak…

阅读更多...

OpenCV-32 膨胀操作

OpenCV-32 膨胀操作

膨胀是与腐蚀相反的操作，基本原理是只要保证卷积核的锚点是非0值，周边无论是0还是非0值，都变为0。使用API---dilate（img， kernel， iterationms 1） 示例代码如下： import cv2 imp…

阅读更多...

【图论】基环树

【图论】基环树

基环树其实并不是树，是指有n个点n条边的图，我们知道n个点n-1条边的连通图是树，再加一条边就会形成一个环，所以基环树中一定有一个环，长下面这样： 由基环树可以引申出基环内向树和基环外向树基环内向树如…

阅读更多...

学习VR全景拍摄，如何选择适合的VR全景设备？

学习VR全景拍摄，如何选择适合的VR全景设备？

随着VR全景技术的不断成熟和发展，VR全景已经成为摄影爱好者、地产行业、中介经纪人、广告、企业宣传等行业从业者们乐于尝试的新领域、新手段。如何选择合适的VR全景设备成为了一个重要的问题。今天，和大家聊一聊，不同行业、人群和用途更适合…

阅读更多...

【Qt】Android上运行keeps stopping, Desktop上正常

【Qt】Android上运行keeps stopping, Desktop上正常

文章目录问题 & 背景背景问题解决方案One More ThingTake Away 问题 & 背景背景在文章【Qt】最详细教程，如何从零配置Qt Android安卓环境中，我们在Qt中配置了安卓开发环境，并且能够正常运行。但笔者在成功配置并完成上述文章…

阅读更多...

【蓝桥杯冲冲冲】[NOIP2017 提高组] 宝藏

【蓝桥杯冲冲冲】[NOIP2017 提高组] 宝藏

蓝桥杯备赛 | 洛谷做题打卡day29 文章目录蓝桥杯备赛 | 洛谷做题打卡day29[NOIP2017 提高组] 宝藏题目背景题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1样例 #2样例输入 #2样例输出 #2提示题解代码我的一些话[NOIP2017 提高组] 宝藏题目背景 NOIP2017 D2T2 题目描…

阅读更多...

ChatGPT辅助编程，一次有益的尝试

如果大家想学习PCIe，搜索网上的信息，大概率会看到chinaaet上Felix的PCIe扫盲系列的博文 Felix-PCIe扫盲每次看这个系列博文的时候，我都在想有没有什么方法可以把这个系列的博文都保存到一个pdf文件中，这样方便阅读。于是有了下…

阅读更多...

tkinter绘制组件（41）——菜单按钮

tkinter绘制组件（41）——菜单按钮

tkinter绘制组件（41）——菜单按钮引言布局函数结构按钮部分菜单显示完整代码函数效果测试代码最终效果 github项目pip下载结语引言 TinUI5的新控件，菜单按钮，menubutton。这是一个与TinUI菜单（menubar&#xff0…

阅读更多...

算法之双指针系列1

算法之双指针系列1

目录一：双指针的介绍 1：快慢指针 2：对撞指针二：对撞指针例题讲述一：双指针的介绍在做题中常用两种指针，分别为对撞指针与快慢指针。 1：快慢指针简称为龟兔赛跑算法，它的基…

阅读更多...

上海泗博HART转ModbusTCP网关HME-635应用案例之组态王和超声波液位计通信

上海泗博HART转ModbusTCP网关HME-635应用案例之组态王和超声波液位计通信

如今工业现场的应用也逐渐把现场的不同应用协议转换成以太网，以此来提升现场的通信速度和质量。Modbus TCP是工业以太网协议的一种，也是现场应用中最常使用的。本应用案例是基于Modbus TCP的组态王和基于HART的超声波液位计之间数据通讯的具体应用。应用…

阅读更多...

STM32F407 CAN参数配置 500Kbps

STM32F407 CAN参数配置 500Kbps

本篇CAN参数适用芯片型号：STM32F407xx系统时钟：168MHz，CAN挂载总线APB1为42M波特率 ：500Kpbs引脚使用：TX_PB9，RX_PB8；修改为PA11PA12后，参数不变。步骤一、打勾开启CAN&#xf…

阅读更多...

vector类的模拟实现

vector类的模拟实现

实现基本的vector框架参考的是STL的一些源码，实现的vector也是看起来像是一个简略版的，但是看完能对vector这个类一些接口函数更好的认识。我们写写成员变量，先来看看STL的成元变量是那些 namespace tjl {template<class T>class …

阅读更多...

无损音乐下载，最新音乐下载，mp3格式音乐下载，一键下载mp3格式音乐，我只用这个软件，歌曲资源丰富，全网音乐免费下载，稳定运行，告别收费

无损音乐下载，最新音乐下载，mp3格式音乐下载，一键下载mp3格式音乐，我只用这个软件，歌曲资源丰富，全网音乐免费下载，稳定运行，告别收费

一、软件简介现在很多支持一键下载mp3音乐/无损音质音乐的音乐播放器通常都是解析接口套了一个壳，一旦解析接口失效，软件就不能下载音乐了，因此一个稳定的解析接口是这类软件最大的保障。本次小编推荐的音乐下载软件接口非常稳定&#xff0…

阅读更多...

C语言：函数

C语言：函数

创作不易，友友们给个三连吧！！ 一、函数的概念数学中我们见过函数的概念，例如ykxb，k和b都是常数，给任意一个x就可以得到y 而C语言也引入了函数（function）这个概念，C语…

阅读更多...

利用LLM大模型生成sql的深入应用探究

利用LLM大模型生成sql的深入应用探究

Chat2DB 是一款有开源免费的多数据库客户端工具,和传统的数据库客户端软件Navicat、DBeaver 相比 Chat2DB 集成了 AIGC 的能力，能够将自然语言转换为 SQL，也可以将 SQL 转换为自然语言，可以给出研发人员 SQL 的优化建议，极大地提升…

阅读更多...

初识C语言·预处理详解

初识C语言·预处理详解

目录 1 预定义符号 2 define定义常量 3 #define定义宏 4 带有副作用的宏 5 宏替换的规则 6 宏和函数的对比 7 # 和 ## i) #运算符 ii) ##运算符 8 命名约定 9 命令行定义 10 条件编译条件编译1： 条件编译2： 条件编译3： 条件…

阅读更多...

单片机学习笔记---LED点阵屏的工作原理

单片机学习笔记---LED点阵屏的工作原理

目录 LED点阵屏分类 LED点阵屏显示原理 74HC595的介绍一片74HC595的工作原理多片级联工作原理总结 LED点阵屏由若干个独立的LED组成，LED以矩阵的形式排列，以灯珠亮灭来显示文字、图片、视频等。LED点阵屏广泛应用于各种公共场合，如汽…

阅读更多...

鸿蒙（HarmonyOS）项目方舟框架（ArkUI）之ScrollBar组件

鸿蒙（HarmonyOS）项目方舟框架（ArkUI）之ScrollBar组件

鸿蒙（HarmonyOS）项目方舟框架（ArkUI）之ScrollBar组件一、操作环境操作系统: Windows 10 专业版、IDE:DevEco Studio 3.1、SDK:HarmonyOS 3.1 二、ScrollBar组件鸿蒙（HarmonyOS）滚动条组件ScrollBar&…

阅读更多...

最新文章

推荐文章