大模型微调十诫：关于将微调模型部署到生产环境的十条建议

大模型微调十诫：关于将微调模型部署到生产环境的十条建议

news/2024/12/23 21:28:16/文章来源:https://blog.csdn.net/weixin_44292902/article/details/142818869

转自NLP工程化

大模型微调十诫：关于将微调模型部署到生产环境的十条建议：

（1）不要盲目微调模型，先尝试使用提示的方式满足需求。只有当提示无法达到质量、性能或成本目标时，才考虑微调。

（2）一定要编写提示。通过提示证明任务是可行的，作为微调的基线。如果提示就可以达到要求，微调可以进一步提升；如果提示不起作用，微调成功的可能性就很低。

（3）一定要检查数据质量。删除或修正问题数据。数据质量直接决定模型质量。

（4）使用真实数据进行微调。即使存在一些不完美的数据也没关系，只要整体分布正确就可以。

（5）留出部分数据作为测试集。不要将所有数据都用于训练。

（6）选择合适的模型规模。不要使用过大的模型，也不要使用过小的模型。规模要匹配任务难度。

（7）编写快速的评估指标。可以多次每天评估，以便快速迭代。

（8）同时编写完整的评估。定期进行完整评估，确保快速指标和最终指标一致。

（9）不要执行一次性的模型训练后就结束。持续优化模型和管道。

（10）不要死板地遵循这些建议。根据具体情形调整建议的适用性。

参考文献：

[1] https://docs.google.com/presentation/d/1IIRrTED0w716OsU_-PL5bONL0Pq_7E8alewvcJO1BCE/edit#slide=id.g2721fb6713e_0_44

想要掌握如何将大模型的力量发挥到极致吗？2024年10月26日叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具。

留言“参加”即可来叶老师的直播间互动，1小时讲解让您轻松上手，学习如何使用 Llama Factory 微调模型。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/443669.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

RabbitMQ延迟队列

RabbitMQ延迟队列

1场景： 1.下单之后，给10分钟时间进行支付，如果10分钟后，没有支付，订单取消。（可以使用队列的ttl，因为所有的消息都是一样的停留时长10分钟） 2.定时发布文章（要求4月1号…

阅读更多...

MPA-SVM多变量分类预测|海洋捕食者优化算法-支持向量机|Matalb

MPA-SVM多变量分类预测|海洋捕食者优化算法-支持向量机|Matalb

目录一、程序及算法内容介绍： 基本内容： 亮点与优势： 二、实际运行效果： 三、算法介绍： 四、完整程序下载： 一、程序及算法内容介绍： 基本内容： 本代码基于Matlab平台编译&…

阅读更多...

JavaScript 数组简单学习

JavaScript 数组简单学习

目录 1. 数组 1.1 介绍 1.2 基本使用 1.2.1 声明语法 1.2.2 取值语法 1.2.3 术语 1.3 案例 1. 数组 1.1 介绍 1.2 基本使用 1.2.1 声明语法 1.2.2 取值语法 1.2.3 术语 1.3 案例

阅读更多...

基于java+springboot的旅游信息网站、旅游景区门票管理系统设计与实现

基于java+springboot的旅游信息网站、旅游景区门票管理系统设计与实现

该系统是基于javaspringboot开发的旅游景区门票管理系统。是给师弟开发的大四实习作品。学习过程中，遇到问题可以咨询github作者。演示地址前台地址： http://travel.gitapp.cn 后台地址： http://travel.gitapp.cn/admin 后台管理帐号&am…

阅读更多...

植物大战僵尸修改器-MFC

植物大战僵尸修改器-MFC

创建项目创建mfc应用基于对话框打开资源视图下的 IDD_MFCAPPLICTION2_DIALOG 限制对话框大小将属性中Border的值改为对话框外框删除对话框中原有的控件属性-外观-Caption 设置对话框标题工具箱中拖放一个按钮修改按钮名称将按钮ID改为IDC_COURSE 在MFCApplication2…

阅读更多...

Fiddler配合wireshark解密ssl

Fiddler配合wireshark解密ssl

环境： win11（wireshark）--虚拟机win7（Fiddler）---虚拟机win7（HTTPS站点） 软件安装问题： 需要.net环境，NDP461-KB3102436-x86-x64-AllOS-ENU.exe。安装fiddler后安装下…

阅读更多...

Golang通用代码生成器：仙童,电音仙女尝鲜版十二,为售前准备的哑数据模式

Golang通用代码生成器：仙童,电音仙女尝鲜版十二,为售前准备的哑数据模式

Golang通用代码生成器：仙童,电音仙女尝鲜版十二,为售前准备的哑数据模式哑数据模式是一种使用内存数据的为快速原型准备的模式。专门为售前，产品经理和项目经理准备。Golang通用代码生成器支持此种模式，请见视频：https://www.bi…

阅读更多...

【Qt+Python项目构建】- 02 Qt creator 14.0 + PySide6 如何让图像控件的尺寸变化和窗口一致

【Qt+Python项目构建】- 02 Qt creator 14.0 + PySide6 如何让图像控件的尺寸变化和窗口一致

前言：【这是个AI不会回答的问题】 Qt Creator 新的版本又发出了，Pyside6 有很多新功能。但是，一些传统的方法要被淘汰了。一个经典的例子是： 我有个一个图像要显示在Form里面的图像控件上，OK， 我现在拖…

阅读更多...

HarmonyOs 查看官方文档使用弹窗

1. 学会查看官方文档 HarmonyOS跟上网上的视频学习一段时间后，基本也就入门了，但是有一些操作网上没有找到合适教学的视频，这时，大家就需要养成参考官方文档的习惯了，因为官方的开发文档是我们学习深度任何一门语言或…

阅读更多...

AI资深导师指导-ChatGPT深度科研工作应用、论文撰写、数据分析及机器学习与AI绘图

AI资深导师指导-ChatGPT深度科研工作应用、论文撰写、数据分析及机器学习与AI绘图

2022年11月30日，可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5，将人工智能的发展推向了一个新的高度。2023年4月，更强版本的ChatGPT4.0上线，文本、语音、图像等多模态交互方式使其在…

阅读更多...

嵌入式硬件设计中EDA布局与布线实现

嵌入式硬件设计中EDA布局与布线实现

大家好，今天主要给大家分享一下，如何使用立创EDA进行布局和布线，具体实现过程如下：第一：PCB概念介绍在介绍PCB的时候，先来说明一下，电子管的发明史。贝尔在1876年发明了电话，爱迪生1879年发明了白炽灯、特斯拉于1888年发明了电动机，所有这些，都为电子学的诞生准…

阅读更多...

如何修改银河麒麟高级服务器操作系统修改网卡名称（如从ens33到eth0）

如何修改银河麒麟高级服务器操作系统修改网卡名称（如从ens33到eth0）

如何修改银河麒麟高级服务器操作系统修改网卡名称（如从ens33到eth0） 💖The Begin💖点点关注，收藏不迷路💖 查找并修改配置文件： 使用ifconfig查看网卡名称（如enp1s0）。找…

阅读更多...

计算机网络实验一：组建对等网络

计算机网络实验一：组建对等网络

实验一组建对等网络实验要求： 1. 组建对等网络，会在命令行使用ipconfig，两网络能够相互ping通，尝试netstat 命令 2. 建立局域网共享文件夹 3. 安装packet tracer，模拟组建对等网并测试对等网 1、组建对等网络连…

阅读更多...

HAL+M4学习记录_4

HAL+M4学习记录_4

一、按键记录学习使用HAL库读取板载按键输入键值板载三颗按键，引脚配置如下其中K_UP按键按下为高电平，那么PA0引脚要配置为下拉模式；K0和K1按下为低电平，那么PE4和PE3引脚要配置为上拉模式。二、通过按键控制LED 这里实现的…

阅读更多...

保姆教程篇：手把手教你从零开始本地部署Dify工作流

保姆教程篇：手把手教你从零开始本地部署Dify工作流

本教程将指导您在个人电脑上安装和配置 Dify。为什么需要Dify 在开始具体的教程之前，先搞清楚为什么要选择 Dify。 6 月份，阿里巴巴全球数学竞赛中，首次接受AI参赛。结果令人大跌眼镜：AI选手们的表现完全无法与人类选手相提并…

阅读更多...

STM32外设详解——ADC

STM32外设详解——ADC

来源：铁头山羊基本概念 ①ADC是模数转换器的统称，stm32f103c8t6内部集成了2个12位主次逼近型ADC，外设名称为ADC1、ADC2。 ② 采样深度为12位意味着ADC可以将0~3.3V的模拟电压等比转换为0~4095的数字值（分割为2的12次方份&…

阅读更多...

SOMEIP_ETS_178: Subscribe_using_wrong_SOMEIP_MessageID

SOMEIP_ETS_178: Subscribe_using_wrong_SOMEIP_MessageID

测试目的： 验证DUT能够拒绝一个SOME/IP头部使用错误消息ID进行服务发现的SubscribeEventgroup消息，并以SubscribeEventgroupNAck作为响应。描述本测试用例旨在确保DUT遵循SOME/IP协议，当接收到一个使用错误消息ID的服务发现SubscribeEve…

阅读更多...

YOLO--前置基础词-学习总结（上）

YOLO--前置基础词-学习总结（上）

RFBNet是什么意思 RFBNet 是一种用于目标检测的深度学习网络，它的名字来源于 "Receptive Field Block Network"（感受野块网络）。简单来说，RFBNet 是一种可以让计算机更好地“看”图像中不同大小的物体的方法。在图像处…

阅读更多...

Python FFmpeg 安装使用教程

Python FFmpeg 安装使用教程

文章目录什么是 FFmpeg？主要功能包括： Windows 下载安装下载解压安装配置环境变量使用案例使用 ffmpeg-python 库转换视频格式视频剪辑添加字幕使用 subprocess.run 执行视频格式转换其它问题ffmpeg 不是内部或外部命令,也不是可运行的程序个人简介…

阅读更多...

虹软人脸报错 Can‘t find dependent libraries

虹软人脸报错 Can‘t find dependent libraries

系列文章目录文章目录系列文章目录一、虹软人脸报错 Can‘t find dependent libraries 一、虹软人脸报错 Can‘t find dependent libraries 在项目中使用了虹软人脸识别SDK，环境一直出错。错误： Can’t find dependent libraries 从错误信息来…

阅读更多...

最新文章

推荐文章