[论文笔记] llama-factory 微调qwen2.5、llama3踩坑

[论文笔记] llama-factory 微调qwen2.5、llama3踩坑

news/2024/10/24 18:29:28/文章来源:https://blog.csdn.net/Trance95/article/details/143045575

一、bug

1、pre-tokenize的时候, 会OOM

解决：在yaml文件中添加streaming参数

# tokenize
streaming: True
max_steps: 10000

https://github.com/hiyouga/LLaMA-Factory/blob/3a023bca2a502810a436cfba7708df164754ea62/src/llamafactory/hparams/data_args.py#L39-L41

streaming: bool = field(
default=False,
metadata={"help": "Enable dataset streaming."},

max_steps: 10000

<

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/455561.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【c++差分数组】P9583涂色

【c++差分数组】P9583涂色

本文涉及知识点 C差分数组 P9583涂色 n行m列方格纸，初始是白色(0层)。共涂色q次，每次选择一行或一列，将这行或列涂一层颜色。如果某次涂色后，某个单格是k层颜色，则涂为白色(0层）。求最后被涂色的单格数量…

阅读更多...

【Golang】Gin框架中如何定义路由

【Golang】Gin框架中如何定义路由

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯，先赞后看哦~🎈🎈 🏆 作者简介：景天科技苑 🏆《头衔》：大厂架构师，华为云开发者社区专家博主，…

阅读更多...

2024 年最热门的人工智能趋势

2024 年最热门的人工智能趋势

文章目录 1. 生成式人工智能（Generative AI）的全面普及2. 多模态 AI 的崛起3. AI 与自动化的深度融合4. 隐私保护与安全 AI5. AI 驱动的个性化体验6. 低代码与无代码 AI 开发工具7. AI 与边缘计算的结合总结博主介绍：全网粉丝10w、CSDN合伙人…

阅读更多...

vuetify页面布局

vuetify页面布局

效果图： 这个布局用到了以下组件： 1.v-navigation-drawer侧边栏 rail：用来控制侧边栏折叠和展开状态，等于false，是展开状态，否则折叠状态。permanent：等于true的时候，无论屏幕大小…

阅读更多...

vue elementui el-table实现增加行，行内编辑修改

vue elementui el-table实现增加行，行内编辑修改

需求： 前端进行新增表单时，同时增加表单的明细数据。明细数据部分，可进行行编辑。效果图： <el-card><div slot"header"><span style"font-weight: bold">外来人员名单2</span><…

阅读更多...

鼠标移入盒子，盒子跟随鼠标移动

鼠标移入盒子，盒子跟随鼠标移动

demo效果： 鼠标移入盒子，按下鼠标,开启移动跟随移动模式,再次按下关闭移动模式涉及主要属性在元素上单击鼠标按钮时输出鼠标指针的坐标： var x event.pageX; // 获取水平坐标 var y event.pageY; // 获取垂直坐标元素offsetL…

阅读更多...

十、pico+Unity交互开发教程——射线抓取与更多交互功能

十、pico+Unity交互开发教程——射线抓取与更多交互功能

一、回顾与引入回顾上一篇直接抓取的教程，VR交互一般需要可交互的对象（Interactable）和发起交互的对象（Interactor）。直接抓取和射线抓取的可交互对象无区别，可参考上一篇教程设置组件。两者区别在于发起…

阅读更多...

NVR小程序接入平台/设备EasyNVR多个NVR同时管理的高效解决方案

NVR小程序接入平台/设备EasyNVR多个NVR同时管理的高效解决方案

在当今的数字化安防时代，视频监控系统的需求日益复杂和多样化。为了满足不同场景下的监控需求，一种高效、灵活且兼容性强的安防视频监控平台——NVR批量管理软件/平台EasyNVR应运而生。本篇探讨这一融合所带来的创新与发展。一、NVR监测软件/设备EasyNV…

阅读更多...

J.D商品详情，一“网”打尽 —— PHP爬虫API数据获取全攻略

J.D商品详情，一“网”打尽 —— PHP爬虫API数据获取全攻略

在当今数字化时代，数据已成为最宝贵的资源之一。对于电商平台而言，实时掌握商品的详细信息，如同拥有了解锁市场动态的金钥匙。J.D，作为中国领先的电商平台，其商品详情数据的获取，更是电商领域的一大热点。本…

阅读更多...

麒麟V10、UOS系统实现在线合并多个Word文件

麒麟V10、UOS系统实现在线合并多个Word文件

不管是将多个Word文件插入到Word模板指定位置，生成一个合并文档，还是将多个Word文档插入到一个空白的Word文件中，首尾连接成一篇文档，都需要用到PageOffice提供的数据区域插入Word文档功能。在实际项目开发中，以下场景…

阅读更多...

【前端】如何制作一个自己的网页（18）定义列表

【前端】如何制作一个自己的网页（18）定义列表

三、定义列表（Definition List） 除了有序和无序列表，还有一种HTML列表类型，被称为定义列表。应用场景：对某个术语或内容进行解释和描述，所以由标题和描述两部分组成，描述是对标题的解释和说明…

阅读更多...

docker harbor

docker harbor

文章目录一，搭建私有仓库1.1下载registry1.2在 daemon.json 中添加私有镜像仓库地址1.3重新加载重启docker1.4运行容器1.5拉取一个centos7镜像1.6给镜像加标签1.7上传镜像1.8显示私有仓库的所有镜像1.8查看私有仓库的 centos 镜像有哪些tag 二，什么是ho…

阅读更多...

Linux Redis查询key与移除日常操作

Linux Redis查询key与移除日常操作

维护老项目Express node 编写的后端程序、有这么一个方法、没有设置redis过期时间（建议设置过期时间，毕竟登录生产服务器并不是每个人都有权限登录的！！！）。如果变动只能通过登录生产服务器、手动修改… 于…

阅读更多...

你还在使用存储过程吗？

你还在使用存储过程吗？

上周，reddit 网 r/dotnet 区的网友 technolang 发帖：「你还在使用存储过程吗？」我很好奇为什么 2024 年了我们还在使用存储过程。难道网络应用中没有一个业务层来处理所有事情吗？依赖 DBA 并在数据库层创建依赖关系似乎没有必要。…

阅读更多...

【WRF数据处理】基于GIS4WRF插件将geotiff数据转为tiff（geogrid，WPS所需数据）

【WRF数据处理】基于GIS4WRF插件将geotiff数据转为tiff（geogrid，WPS所需数据）

【WRF数据处理】基于GIS4WRF插件将geotiff数据转为tiff（geogrid，WPS所需数据） 数据准备：以叶面积指数LAI为例QGis实操：基于GIS4WRF插件将geotiff数据转为tiff警告：GIS4WRF: Input layer had an unexpected …

阅读更多...

ONLYOFFICE 文档8.2版本已发布：PDF 协作编辑、改进界面、性能优化等更新

ONLYOFFICE 在线编辑器最新版本已经发布，其中包含30多个新功能和500多个错误修复。阅读本文了解所有更新。关于 ONLYOFFICE 文档 ONLYOFFICE 是一个开源项目，专注于高级和安全的文档处理。坐拥全球超过 1500 万用户，ONLYOFFICE 是在线办公领…

阅读更多...

2024年 Spring Boot 系列学习宝典！！！！！

2024年 Spring Boot 系列学习宝典！！！！！

欢迎来到Spring Boot的世界！本系列文章旨在为开发者提供从入门到精通的全面指导，无论你是Spring Boot新手还是有经验的开发者，都能在这里找到有价值的内容。让我们一起踏上这段旅程，探索如何使用Spring Boot构建高效、可扩展的应用…

阅读更多...

Redis底层和缓存雪崩，击穿，穿透

Redis底层和缓存雪崩，击穿，穿透

一、Redis的数据结构 1.动态字符串我们知道Redis中保存的Key是字符串，value往往hi字符串或者字符串的集合。可见字符串是Redis中最常用的一种数据结构。不过，Redis 没有直接使用c语言的字符串，因为c语言字符串存在许多问题： …

阅读更多...

蚁剑连接本地木马文件报错

蚁剑连接本地木马文件报错

项目场景： 本地搭建php和蚁剑环境，连接本地木马文件ma.php 问题描述使用蚁剑连接localhost时报错错误{ "address":"127.0.0.1" "code":"ECONNREFUSED", "errno":"ECONNREFUSED", &qu…

阅读更多...

【Kubernetes实战】Kubernetes集群搭建(虚拟机环境，一主两从)

【Kubernetes实战】Kubernetes集群搭建(虚拟机环境，一主两从)

目录一、以Node1节点为例创建虚拟机二、环境初始化三、集群所需组件安装1. docker（18.06.3）2. 安装Kubernetes组件四、安装Kubernetes集群1. 准备集群镜像2. 集群初始化3. 安装网络插件五、环境测试(服务部署) 集群规模：一主二从(一个ma…

阅读更多...

最新文章

推荐文章