大语言模型数据类型与环境配置

文章目录

  • 前言
  • 一、环境安装
  • 二、大语言模型数据类型
    • 1、基本文本指令数据类型
    • 2、数学指令数据类型
    • 3、几何图形指令数据类型
    • 4、多模态指令数据类型
    • 5、翻译指令数据类型
  • 三、vscode配置

前言

简单给出环境安装与数据类型及vscode运行配置,其中vscode运行配置是便于我们调试代码。

一、环境安装

直接下面一句话,可实现环境安装,如下:

pip install -r requirements.txt  

而requirements.txt内容如下:

peft==0.7.1
torch==2.1.1
transformers==4.40.0
bitsandbytes
datasets
safetensors
scikit-learn
deepspeed

二、大语言模型数据类型

大语言模型任务很多是和数据挂钩,给什么样的数据,便会训练成不同任务模型,我给出网上一些样列,这些数据基本来源huggingface,给出部分样例供参考!

1、基本文本指令数据类型

在这里插入图片描述

2、数学指令数据类型

在这里插入图片描述

3、几何图形指令数据类型

在这里插入图片描述

4、多模态指令数据类型

在这里插入图片描述

5、翻译指令数据类型

在这里插入图片描述

三、vscode配置

我先使用python与torchrun方法来运行训练脚本,理论上需改写成一个sh脚本,这些都比较简单。这里,是为了自己搭建大语言模型llama3,为了调试运行正确与否,我先直接给出vscode配置内容,依然是launch.json配置,如下:

{"version": "0.2.0","configurations": [{"name": "train_llama3","type": "python","request": "launch","python": "/home/miniconda3/envs/llama3/bin/python", // 指定python解释器"program": "/language_model/Chinese-LLaMA-Alpaca-3-main/llama3_model/main.py","console": "integratedTerminal","justMyCode": false, "args": [ "--model_name_or_path","/language_model/Chinese-LLaMA-Alpaca-3-main/llama3_8b_weight","--tokenizer_name_or_path","/language_model/Chinese-LLaMA-Alpaca-3-main/llama3_8b_weight","--dataset_dir","/language_model/Chinese-LLaMA-Alpaca-3-main/data_math/school_math.json","--output_dir","./output_dir",// trainer的参数"--data_cache_dir","temp_data_cache_dir","--torch_dtype","bfloat16","--per_device_train_batch_size","1","--do_train","--low_cpu_mem_usage","--num_train_epochs","1","--lr_scheduler_type", "cosine","--learning_rate","1e-4","--warmup_ratio","0.05","--weight_decay","0.01","--logging_strategy","steps", "--logging_steps","10","--save_strategy","steps","--save_total_limit","3","--save_steps","240","--gradient_accumulation_steps","8","--preprocessing_num_workers","8","--tune_lm_head","False","--use_lora","True","--lora_rank","64","--lora_alpha","128","--lora_trainable","q_proj,v_proj,k_proj,o_proj,gate_proj,down_proj,up_proj","--lora_dropout","0.05",],"env": {"CUDA_VISIBLE_DEVICES": "0"},},}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/456089.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

专业135+总分400+西安交通大学815869(原909)信号与系统考研经验电子信息与通信工程,真题,大纲,参考书

经过将近一年的考研复习,终于梦圆西安交大,今年专业课815(和专硕869(原909)差不多)信号与系统135,总分400,回想这一年的复习还有很多经验和大家分享,希望可以对大家复习有所帮助,少走…

3.cpp基本数据类型

cpp基本数据类型 1.cpp基本数据类型 1.cpp基本数据类型 C基本数据类型和C语言的基本数据类型差不多 注意bool类型&#xff1a;存储真值 true 或假值 false&#xff0c;C语言编译器C99以上支持。 C语言的bool类型&#xff1a;要添加 #include <stdbool.h>头文件 #includ…

数据库相关知识点

1. 数据库分片与分区 分片&#xff08;Sharding&#xff09;&#xff1a;这是一种将数据水平分割的技术&#xff0c;每个分片包含数据的一个子集。分片通常用于提高数据库的扩展性和性能&#xff0c;特别是在处理大量数据时。通过将数据分布在多个分片上&#xff0c;可以并行处…

ruoyi域名跳转缓存冲突问题(解决办法修改:session名修改session的JSESSIONID名称)

【版权所有&#xff0c;文章允许转载&#xff0c;但须以链接方式注明源地址&#xff0c;否则追究法律责任】【创作不易&#xff0c;点个赞就是对我最大的支持】 前言 仅作为学习笔记&#xff0c;供大家参考 总结的不错的话&#xff0c;记得点赞收藏关注哦&#xff01; 目录 前…

Maven基础知识

一、Maven的概述 maven 是什么&#xff1f; 是一个项目管理工具&#xff0c;它包含了一个项目对象模型&#xff0c;一组标准集合&#xff0c;一个项目的生命周期&#xff0c;一个依赖管理系统&#xff0c;和用来运行定义在生命周期阶段和插件目标的逻辑。 二、Maven的依赖管理…

【331】基于Springboot的“有光”摄影分享网站系统

“有光”摄影分享网站设计与实现 摘 要 自互联网的发展至今&#xff0c;其基础理论与技术都已完善&#xff0c;并积极参与了整个社会各个领域。它容许信息根据媒体传播&#xff0c;并和信息可视化工具一起为大家提供优质的服务。对于信息多头管理、差错率高、信息安全系数差、…

Redis 命令集 (超级详细)

目录 Redis 常用命令集 string类型 hash类型 list类型 set类型 zset类型 bitmap 类型 geo 类型 GEOADD (添加地理位置的坐标) GEOPOS (获取地理位置的坐标) GEODIST (计算两个位置之间的距离) GEOHASH (返回一个或多个位置对象的 geohash 值) GEORADIUS (根据用户…

本地docker部署中间件和应用

Docker Desktop搭建 安装完成之后使用docker下载镜像&#xff0c;报以下错误&#xff1a; 解决办法&#xff1a; Docker Engine配置能访问的镜像地址&#xff1a; {"builder": {"gc": {"defaultKeepStorage": "20GB","enabled…

Vue实现手风琴功能组件 vue 实现折叠面板功能

Vue实现手风琴功能组件 vue 实现折叠面板功能,前端不使用第三方组件实现手风琴折叠面板功能 效果图: dom<div class="foldSection"><divv-for="(item, index) in ListData":key="item.id"class="accordion"><div …

反编译工具jadx

一.官网 https://github.com/skylot/jadx 下载解压即可 二.使用 将想要反编译的apk文件拖入jadx中&#xff0c;等待反编译结束。 三.提醒 反编译出来的只能帮你理解逻辑&#xff0c;并且一般apk都会有加密。

SLAM|2. 差异与统一:坐标系变换与外参标定

本章主要内容 1.坐标系变换 2.相机外参标定 上一章我们了解了相机内参的概念&#xff0c;内参主要解决三维世界与二维图像之间的映射关系。有了内参我们可以一定程度上还原相机看到了什么&#xff08;但缺乏尺度&#xff09;。但相机看到的数据只是处于相机坐标系&#xff0c;为…

【Qt6聊天室项目】 主界面功能实现

1. 获取当前用户的个人信息 1.1 前后端逻辑分析&#xff08;主界面功能&#xff09; 主界面上所有的前后端交互逻辑相同&#xff0c;分析到加载会话列表后其余功能仅实现。 核心逻辑总结 异步请求-响应模型 客户端发起请求&#xff0c;向服务器发送包含会话ID的请求服务端处…

ASP.NET Core 8.0 中使用 Hangfire 调度 API

在这篇博文中&#xff0c;我们将引导您完成将 Hangfire 集成到 ASP.NET Core NET Core 项目中以安排 API 每天运行的步骤。Hangfire 是一个功能强大的库&#xff0c;可简化 .NET 应用程序中的后台作业处理&#xff0c;使其成为调度任务的绝佳选择。继续阅读以了解如何设置 Hang…

计算机毕业设计PySpark+大模型高考推荐系统 高考分数线预测 高考爬虫 协同过滤推荐算法 Vue.js Django Hadoop 大数据毕设

基于Spark的高考报名信息推荐系统 系统用到的各项技术和工具的介绍&#xff1a; 1. Python Python是一种高级的、解释型的程序设计语言&#xff0c;因为其简洁而易学、可读性强等特点&#xff0c;在数据处理、人工智能、机器学习、Web开发等领域得到了广泛运用。在该系统中…

php AES 加解密(支持在线运行)

https://andi.cn/page/621792.html 这篇文章不仅给出了 php AES 加解密代码&#xff0c;而且可以在线运行来对数据进行加解密&#xff0c;满足实际中的一些需求。

C语言初阶七:C语言操作符详解(1)

#1024程序员节|征文# 这篇文章是对之前文章中操作符的补充&#xff0c;可以看之前的文章&#xff1a;C语言初阶&#xff1a;六.算数操作_如何用编程表示除法-CSDN博客 C语言操作符是用于执行各种运算和操作的符号。包括算术操作符&#xff08;如、-、*、/、%&#xff09;&#…

Python URL编码

在 Python 中&#xff0c;可以使用 urllib.parse模块对 URL 进行编码。 一、依赖安装 pip install urllib 二、URL编码 from urllib.parse import quoteurl rhttps://myshop.com/shop/shopList?query query {"id":14,"pageSize":10,"pageNum&quo…

[软件工程]—桥接(Brige)模式与伪码推导

桥接&#xff08;Brige&#xff09;模式与伪码推导 1.基本概念 1.1 动机 由于某些类型的固有的实现逻辑&#xff0c;使它们具有两个变化的维度&#xff0c;乃至多个维度的变化。如何应对这种“多维度的变化”&#xff1f;如何利用面向对象技术是的类型可以轻松的沿着两个乃至…

新鲜出炉面试题之【说说spring spring MVC spring boot的区别】

Spring MVC 和 Spring Boot 是 Spring 框架的一部分&#xff0c;但它们的目的和用途有所不同。下面详细阐述这两者之间的区别。 1. 概念 Spring MVC&#xff1a; Spring MVC 是一种基于请求-响应模式的 Web 框架&#xff0c;属于 Spring 框架的一部分。它提供了一种分离的方式…

html 轮播图效果

轮播效果&#xff1a; 1、鼠标没有移入到banner,自动轮播 2、鼠标移入&#xff1a;取消自动轮播、移除开始自动轮播 3、点击指示点开始轮播到对应位置 4、点击前一个后一个按钮&#xff0c;轮播到上一个下一个图片 注意 最后一个图片无缝滚动&#xff0c;就是先克隆第一个图片…