llamafactory大模型微调教程(周易大模型案例)

1.环境说明

操作系统:ubuntu 20
基础模型:Qwen2.5-1.5B-Instruct
工具:llamafactory
GPU:四张4090

2、环境部署

2.1 下载基础模型

# 1、下载 modelscope
pip install modelscope#2、模型下载
cd /data/
cat >> download.py <<EOF
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen2.5-1.5B-Instruct')
EOF
python download.py#等待下载完成即可

2.2 下载llamafactory工具

#1.克隆仓库
git clone https://github.com/hiyouga/LLaMA-Factory.git
#2.下载依赖
cd LLaMA-Factory
pip install -e .[torch,metrics]
#3、执行需要使用的显卡,运行web
CUDA_VISIBLE_DEVICES=0,1,2,3 python src/webui.py
或者
CUDA_VISIBLE_DEVICES=0,1,2,3 llamafactory-cli webui

3、模型微调训练

3.1 数据准备

1.1 制作数据
LLaMA-Factory/data/ 下面有很多数据格式demo,我们参考这种的就行alpaca_zh_demo.json

下面我们把周易的数据制作成下面的格式:
LLaMA-Factory/data/zhougong.json

[{"instruction": "你是一个周文王,周易的作者,擅长通过梦境去推演现在过去未来","input": "梦见体育教练是什么意思","output": "梦见体育教练有现实的影响和反应,也有梦者的主观想象,请看下面由(周公解梦官网)小编帮你整理的梦见体育教练的详细解说吧。  体育教练的职责是自己出力而让学生获得巨大成功, 所以在梦境中自己充当着教练的角色,或者梦见教练在训练的情景, 这都提示着梦者自己的投资不会获得直接利润。  别人的成功也就是自己的成功,只有这样才能得到心理平衡。梦中教练的身份还提示着不合理冲动、攻击的间接性表达,这类教练都是攻击性、竞技性比较强烈的项目教练,如拳击、击剑,足球、篮球教练等。  梦到体育教练,暗示你的投资不会有利润。  商人梦见体育教练,表示最近自己的事业不会盈利,但是对社会有很大的贡献。  梦见受著名的体育选手指导,健康方面将有不韦。尤其社团活动时,发生事故或受伤的可能性很大。 这个时候,最好避免练球练得太晚。  梦见体育教练的案例分析  梦境描述:不知道为什么,这一个星期来,不论是睡午觉还是晚上睡觉,都会梦见我的体育教练,梦见他对我笑,然后我跟他像好朋友似的,一起玩,一起逛街,为什么呢?如果说这种是恋师,那我又不喜欢他,而且他长得又不算好看,而且还有些讨厌他呢!  梦境解析:很多感情的萌牙都是在不知不觉中进行的,明明自己讨厌着他,不知不觉却离不开他了,只是你现在还没察觉而已。  【大师特色梦境分析】  以上解梦为通用解释,如需知晓具体事宜,可请大师结合您的生辰八字及做梦时的情景解梦:"},{"instruction": "你是一个周文王,周易的作者,擅长通过梦境去推演现在过去未来","input": "梦见贵人是什么意思","output": "梦见贵人有现实的影响和反应,也有梦者的主观想象,请看下面由(周公解梦官网)小编帮你整理的梦见贵人的详细解说吧。    做这种梦见贵人的梦不多,能够梦见贵人表示你能够出人头地的机会很大,未来有一番作为。  如果梦见领袖,则表示心灵上得到安详;如果梦见领袖在行事,则会受到赏识。  一般人梦见自己在贵人面前,表示将会出人头地;但若梦中与贵人为对等地位,则有忧事将至。  原版周公解梦  贵人走马,官事明。《周公解梦》  来见贵人,不得凶。《周公解梦》  梦贵人入家。凡梦官吏人门,富贵大吉。梦欲见贵人官吏而不得见者凶,得见者贵。梦与贵人亲近者吉利,拜谒贵人者主有扶持之力,事无不吉。 《梦林玄解》  梦见拜贵人,吉利。《敦煌本梦书》  梦见贵人赐饭,主病。《敦煌本梦书》  梦见贵人坐,欲贵。《敦煌本梦书》  梦见人拜贵人,吉。《敦煌本梦书》  梦见屋中有贵人,大吉。《敦煌本梦书》  梦见与贵人交往,吉。《敦煌本梦书》  一切贵人,皆吉利。《周公解梦》  做贵人卫兵,主吉。《周公解梦》  【大师特色梦境分析】  以上解梦为通用解释,如需知晓具体事宜,可请大师结合您的生辰八字及做梦时的情景解梦:"},{"instruction": "你是一个周文王,周易的作者,擅长通过梦境去推演现在过去未来","input": "梦见贵族是什么意思","output": "梦见贵族有现实的影响和反应,也有梦者的主观想象,请看下面由(周公解梦官网)小编帮你整理的梦见贵族的详细解说吧。  贵族大多是人们对上层阶级的统称,也大多泛指在社会上享有特权的阶层。  一般贵族代表了身份的高贵,也是财富与社会地位的象征。  梦见与贵族说话,若平静的说话,表示会发生烦恼的事。  梦见贵族人士骂你,表示你的幸运即将来临。  相反的,若是梦见你骂贵族人士,则为凶兆,预示可能会遭遇灾难。  梦见结交贵族,暗示你强烈的愿望并不是很正当的,因为你更喜欢炫耀和享乐,而不是追求心智方面的更高层次的修养。  对于年轻女子,梦见贵族,预示她将在选择伴侣时以貌取人,而不是明智地让品行优秀的男人做她的保护神。  梦见贵族的案件分析  梦境描述:梦见自己是欧洲中世纪贵族家的小姐,好像父亲是一个很有权势的人,家里有女佣,梦中我还有自己喜欢的人。  梦境解析:此梦反映了你热衷于享乐,而自己的实际情况被完全背离,做此梦是提醒你不要过度骄奢淫逸,更应该注重自己内心的修养。  【大师特色梦境分析】  以上解梦为通用解释,如需知晓具体事宜,可请大师结合您的生辰八字及做梦时的情景解梦:"},...]

3.2 注册数据集

LLaMA-Factory/data/dataset_info.json

{"zhougong": {"file_name": "zhougong.json"},"identity": {"file_name": "identity.json"},"alpaca_en_demo": {"file_name": "alpaca_en_demo.json"},....
}

可以看到我注册了一个名字为zhougong的数据集

3.3 大模型训练

在这里插入图片描述
在这里插入图片描述
开始训练
在这里插入图片描述

在模型训练过程中,"loss值"指的是损失函数(Loss Function)计算出来的结果,它是衡量模型预测值与真实值之间差异的一个指标。损失值越小,意味着模型的预测结果与实际数据之间的误差越小,模型的表现就越好。

3.3 新模型验证

在这里插入图片描述
在这里插入图片描述
可以发现新模型已经有效果了,但是由于训练的数据集质量不太行(网上免费的数据,自己做的清洗),造成输出结果不太理想。

3.4 模型权重导出

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/29883.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

06 HarmonyOS Next性能优化之LazyForEach 列表渲染基础与实现详解 (一)

温馨提示&#xff1a;本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦&#xff01; 目录 一、代码结构概览二、详细代码解析1. 数据源管理实现2. 数据结构定义3. 优化的列表项组件4. 主列表组件实现 一、代码结构概览 本文将详细解…

【Linux】线程同步与互斥

线程同步与互斥 一.线程互斥1.互斥相关概念2.互斥锁 Mutex3.互斥锁接口4.互斥锁实现原理5.互斥锁封装 二.线程同步1.同步相关概念2.条件变量 Condition Variable3.条件变量接口4.条件变量封装5.信号量 Semaphore6.信号量接口7.信号量封装 三.生产者 - 消费者模型1.基于 Blockin…

基于大数据的电影情感分析推荐系统

【大数据】基于大数据的电影情感分析推荐系统&#xff08;完整系统源码开发笔记详细部署教程&#xff09;✅ 目录 一、项目简介二、项目界面展示三、项目视频展示 一、项目简介 本系统通过结合Flask框架、Vue前端、LSTM情感分析算法以及pyecharts和numpy、pandas等技术&#x…

网络安全配置截图 网络安全i

网络安全概念及规范 1.网络安全定义 网络安全的概述和发展历史 网络安全 广义的网络安全&#xff1a;Cyber Security&#xff08;网络空间安全&#xff09; 网络空间有独立且相互依存的信息基础设施和网络组成&#xff0c;包括互联网、电信网、计算机系统、嵌入式处理器和控…

测试用例详解

一、通用测试用例八要素   1、用例编号&#xff1b;    2、测试项目&#xff1b;   3、测试标题&#xff1b; 4、重要级别&#xff1b;    5、预置条件&#xff1b;    6、测试输入&#xff1b;    7、操作步骤&#xff1b;    8、预期输出 二、具体分析通…

mybatis映射文件相关的知识点总结

mybatis映射文件相关的知识点总结 mybatis官网地址 英文版&#xff1a;https://mybatis.org/mybatis-3/index.html 中文版&#xff1a;https://mybatis.p2hp.com/ 搭建环境 /* SQLyog Ultimate v10.00 Beta1 MySQL - 8.0.30 : Database - mybatis-label *****************…

智能体开发:推理-行动(ReAct)思维链提示

人类在处理一个需要多个步骤才能完成任务时&#xff0c;显著特点是能够将言语推理&#xff08;内心独白&#xff09;和实际行动融合在一起&#xff0c;在面对陌生或不确定的情况时通过这种方法学习新知识&#xff0c;做出决策&#xff0c;并执行&#xff0c;从而应对复杂的任务…

*VulnHub-FristiLeaks:1.3暴力解法、细节解法,主打软硬都吃,隧道搭建、寻找exp、提权、只要你想没有做不到的姿势

*VulnHub-FristiLeaks:1.3暴力解法、细节解法&#xff0c;主打软硬都吃&#xff0c;隧道搭建、寻找exp、提权、只要你想没有做不到的姿势 一、信息收集 1、扫靶机ip 经典第一步&#xff0c;扫一下靶机ip arp-scan -l 扫描同网段 nmap -sP 192.168.122.0/242、指纹扫描、端口…

Collab-Overcooked:专注于多智能体协作的语言模型基准测试平台

2025-02-27&#xff0c;由北京邮电大学和理想汽车公司联合创建。该平台基于《Overcooked-AI》游戏环境&#xff0c;设计了更具挑战性和实用性的交互任务&#xff0c;目的通过自然语言沟通促进多智能体协作。 一、研究背景 近年来&#xff0c;基于大型语言模型的智能体系统在复…

HTTP 与 HTTPS 协议:从基础到安全强化

引言 互联网的消息是如何传递的&#xff1f; 是在路由器上不断进行跳转 IP的目的是在寻址 HTTP 协议&#xff1a;互联网的基石 定义 HTTP&#xff08;英文&#xff1a;HyperText Transfer Protocol&#xff0c;缩写&#xff1a;HTTP&#xff09;&#xff0c;即超文本传输协…

vue3:初学 vue-router 路由配置

承上一篇&#xff1a;nodejs&#xff1a;express js-mdict 作为后端&#xff0c;vue 3 vite 作为前端&#xff0c;在线查询英汉词典 安装 cnpm install vue-router -S 现在讲一讲 vue3&#xff1a;vue-router 路由配置 cd \js\mydict-web\src mkdir router cd router 我还…

【ARM内核】SWCLK/SWDIO引脚复用

我以CMS32L1032&#xff08;ARMCortex-M0&#xff09;单片机举例&#xff1a; 一、直接将下载端口引脚复用是会出问题的 电平可能跟别的IO不一样&#xff0c;然后还不好用&#xff0c;仔细阅读芯片手册&#xff1a; 然后禁用代码是&#xff1a; //禁用SM调试接口 *(volatil…

一套企业级智能制造云MES系统源码, vue-element-plus-admin+springboot

MES应该是继ERP之后制造企业信息化最热门的管理软件&#xff0c;它适应产品个性化与敏捷化制造需求&#xff0c;满足生产过程精益管理而产生和发展起来的信息系统。 作为企业实现数字化与智能化的核心支撑技术与重要组成部分&#xff0c;MES在帮助制造企业走向数字化、智能化等…

π0及π0_fast的源码解析——一个模型控制7种机械臂:对开源VLA sota之π0源码的全面分析,含我司微调π0的部分实践

前言 ChatGPT出来后的两年多&#xff0c;也是我疯狂写博的两年多(年初deepseek更引爆了下)&#xff0c;比如从创业起步时的15年到后来22年之间 每年2-6篇的&#xff0c;干到了23年30篇、24年65篇、25年前两月18篇&#xff0c;成了我在大模型和具身的原始技术积累 如今一转眼已…

MAVEN的环境配置

在下载好maven后或解压maven安装包后进行环境配置 1.在用户环境变量中 新建一个MAVEN_HOME 地址为MAVEN目录 注&#xff1a;地址为解压后maven文件的根目录&#xff01;&#xff01;&#xff01; 2.在系统环境变量的path中添加该变量 %MAVEN_HOME%\bin 3. 测试maven安装是否成…

03 HarmonyOS Next仪表盘案例详解(二):进阶篇

温馨提示&#xff1a;本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦&#xff01; 文章目录 前言1. 响应式设计1.1 屏幕适配1.2 弹性布局 2. 数据展示与交互2.1 数据卡片渲染2.2 图表区域 3. 事件处理机制3.1 点击事件处理3.2 手势…

taosd 写入与查询场景下压缩解压及加密解密的 CPU 占用分析

在当今大数据时代&#xff0c;时序数据库的应用越来越广泛&#xff0c;尤其是在物联网、工业监控、金融分析等领域。TDengine 作为一款高性能的时序数据库&#xff0c;凭借独特的存储架构和高效的压缩算法&#xff0c;在存储和查询效率上表现出色。然而&#xff0c;随着数据规模…

olmOCR:高效精准的 PDF 文本提取工具

在日常的工作和学习中&#xff0c;是否经常被 PDF 文本提取问题困扰&#xff1f;例如&#xff1a; 想从学术论文 PDF 中提取关键信息&#xff0c;却发现传统 OCR 工具识别不准确或文本格式混乱&#xff1f;需要快速提取商务合同 PDF 中的条款内容&#xff0c;却因工具不给力而…

加速科技Flex10K-L测试机:以硬核创新重塑显示驱动芯片测试新标杆!

在2024年召开的世界显示产业创新发展大会上&#xff0c;加速科技自主研发的高密度显示驱动芯片测试设备Flex10K-L凭借其突破性技术创新&#xff0c;成功入选"十大创新技术&#xff08;产品&#xff09;"。作为国内显示驱动芯片测试领域的标杆性设备&#xff0c;Flex1…

Go语言集成DeepSeek API和GoFly框架文本编辑器实现流式输出和对话(GoFly快速开发框架)

说明 本文是GoFly快速开发框架集成Go语言调用 DeepSeek API 插件&#xff0c;实现流式输出和对话功能。为了方便实现更多业务功能我们在Go服务端调用AI即DeepSeek接口&#xff0c;处理好业务后再用Gin框架实现流失流式输出到前端&#xff0c;前端使用fetch请求接收到流式的mar…