MiniMind——跑通项目

文章目录

📌 Quick Start Train

MiniMind (ModelScope)

# step 1
git clone https://huggingface.co/jingyaogong/minimind-v1

# step 2
python 2-eval.py

或者启动streamlit，启动网页聊天界面

「注意」需要python>=3.10，安装 pip install streamlit==1.27.2

# or step 3, use streamlit
streamlit run fast_inference.py

📌 Quick Start Train

0、克隆项目代码

git clone https://github.com/jingyaogong/minimind.git
cd minimind

1、环境安装

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

# 测试torch是否可用cuda
import torch
print(torch.cuda.is_available())

如果不可用，请自行去torch_stable
下载whl文件安装。参考链接

2、如果你需要自己训练
- 2.1 下载数据集下载地址放到./dataset目录下
- 2.2 python data_process.py处理数据集，例如pretrain数据提前进行token-encoder、sft数据集抽离qa到csv文件
- 2.3 在./model/LMConfig.py 中调整model的参数配置
  
  这里仅需调整dim和n_layers和use_moe参数，分别是(512+8)或(768+16)，对应于minimind-v1-small和minimind-v1
- 2.4 python 1-pretrain.py 执行预训练，得到 pretrain_*.pth 作为预训练的输出权重
- 2.5 python 3-full_sft.py 执行指令微调，得到 full_sft_*.pth 作为指令微调的输出权重
- 2.6 python 4-lora_sft.py 执行lora微调（非必须）
- 2.7 python 5-dpo_train.py 执行DPO人类偏好强化学习对齐（非必须）

3、测试模型推理效果

确保需要使用的，训练完成的参数权重*.pth文件位于./out/目录下

也可以直接去训练完成的模型权重下载使用我训练好的*.pth权重文件

minimind/out
├── multi_chat
│   ├── full_sft_512.pth
│   ├── full_sft_512_moe.pth
│   └── full_sft_768.pth
├── single_chat
│   ├── full_sft_512.pth
│   ├── full_sft_512_moe.pth
│   └── full_sft_768.pth
├── pretrain_768.pth
├── pretrain_512_moe.pth
├── pretrain_512.pth

python 0-eval_pretrain.py测试预训练模型的接龙效果
python 2-eval.py测试模型的对话效果

🍭「Tip」预训练和全参微调pretrain和full_sft均支持多卡加速

假设你的设备只有1张显卡，使用原生python启动训练即可：

执行预训练或指令微调训练

python 1-pretrain.py
# and
python 3-full_sft.py

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/10887.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

MiniMind——跑通项目

文章目录

📌 Quick Start Train

相关文章

JVM方法区

STM32 TIM定时器配置

自定义数据集使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测，对预测结果计算精确度和召回率及F1分数

＜ OS 有关＞阿里云几个小时前使用密钥替换 SSH 密码认证后，发现主机正在被“攻击” 分析与应对

[创业之路-270]：《向流程设计要效率》-2-企业流程架构模式 POS架构(规划、业务运营、支撑）、OES架构（业务运营、使能、支撑）

【贪心算法篇】：“贪心”之旅--算法练习题中的智慧与策略（一）

Python 梯度下降法（二）：RMSProp Optimize

【2025年更新】1000个大数据/人工智能毕设选题推荐

three.js+WebGL踩坑经验合集(6.2):负缩放，负定矩阵和行列式的关系（3D版本）

反向代理模块jmh

软件工程经济学-日常作业+大作业

【回溯】目标和字母大小全排列

告别复杂，拥抱简洁：用plusDays(7)代替plus(7, ChronoUnit.DAYS)

《苍穹外卖》项目学习记录-Day10订单状态定时处理

【深度分析】微软全球裁员计划不影响印度地区，将继续增加当地就业机会

Linux中端口被占用如何解决

qt-Quick3D笔记之官方例程Runtimeloader Example运行笔记

高性能消息队列Disruptor

Spring Boot项目如何使用MyBatis实现分页查询

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】1.27 线性代数王国：矩阵分解实战指南