【Datawhale AI 冬令营】如何动手微调出自己的大模型

【Datawhale AI 冬令营】如何动手微调出自己的大模型

news/2024/12/21 9:35:04/文章来源:https://blog.csdn.net/lsjmax/article/details/144588049

目录

总体思路
- 实操案例
- - 数据集构造
  - - 收集数据
    - 数据构造
  - 模型微调
  - - 选择模型
    - 选择数据集
    - 参数配置
    - 开始训练
  - 模型使用

总体思路

微调大模型主要以开源的通用大模型为基础，喂给模型自己准备的数据，将通用的大模型往自己想要的方向引导，变成更偏向某一领域的大模型。其中最主要的是数据，你希望大模型变成一个什么的大模型，就需要给他喂相应的数据。然后就是算力，微调的代码比较简单，可以自己搭一个环境，写几行模型训练的代码就能训练，也可以找一个模型训练平台，0代码进行大模型微调。比如讯飞星辰平台。

实操案例

以医疗方面的对话大模型为例，演示一下如何微调一个能够回答医疗方面问题的大模型。

数据集构造

收集数据

因为是医疗相关的大模型，需要有医疗相关的数据，比如患者与医生的对话数据集，通过网上搜索，在github上搜索到一份中文医疗对话数据集。
在这里插入图片描述
一共有内科，男科，妇科，肿瘤科，儿科和外科的数据，已经涵盖了大部分常见医疗问题。

数据构造

微调大模型，要求的数据格式分为两种，Alpaca和ShareGPT，具体如下，其实是JSON文件格式，只是必须按照相应的字段名称进行存储。
在这里插入图片描述

在这里插入图片描述
原始数据如下：

需要将ask字段对应的内容变成Alpaca格式中的instruction字段中，把answer的内容变到output字段中。处理代码可以参考下面代码

处理完的数据长下面这样：

模型微调

这里采用讯飞星辰平台进行模型微调训练

选择模型

在这里插入图片描述
输入模型名称，因为是医疗对话模型，回答患者问题，因此选择文本对话模型，在选择基础模型，这个根据问题的复杂度，越复杂需要选择的模型就越大，简单的可以选择小模型，减少训练时长。

选择数据集

点击创建数据集，创建自己自定义的数据集。
在这里插入图片描述
将自己构造的数据集拖到数据导入框中，完成确认即可。

参数配置

大部分参数可以不改变，因为我的数据集8万条，数据量还可以，设置训练次数3次就行，也可以默认参数即可，后续根据模型的表现进行参数调整，提高模型效果。
在这里插入图片描述

开始训练

在这里插入图片描述

在这里插入图片描述
耐心等待模型训练结束。

模型使用

训练完成后，可以将模型发布成一个服务，进行接口调用使用。
在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/492979.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Python编程常用的19个经典案例

Python编程常用的19个经典案例

Python 的简洁和强大使其成为许多开发者的首选语言。本文将介绍36个常用的Python经典代码案例。这些示例覆盖了基础语法、常见任务、以及一些高级功能。 1. 列表推导式 fizz_buzz_list ["FizzBuzz" if i % 15 0 else "Fizz" if i % 3 0 else "Buzz…

阅读更多...

关于数据流图绘制和使用上的一些个人经验

关于数据流图绘制和使用上的一些个人经验

假设我们需要开发一个项目进度管理系统，在这个项目进度管理系统之中，我们需要开发一个功能：项目成员的列表。我们具有这样的业务需求： 在项目进度管理系统中，我们需要知道参与项目的人员到底有哪些，并且项目…

阅读更多...

手眼标定工具操作文档

手眼标定工具操作文档

1.手眼标定原理介绍术语介绍手眼标定：为了获取相机与机器人坐标系之间得位姿转换关系，需要对相机和机器人坐标系进行标定，该标定过程成为手眼标定，用于存储这一组转换关系的文件称为手眼标定文件。 ETH：即Eye To …

阅读更多...

AlipayHK支付宝HK接入-商户收款（PHP）

AlipayHK支付宝HK接入-商户收款（PHP）

一打开支付宝国际版二、点开商户服务三、下载源码

阅读更多...

基于Arduino的平衡车机械臂

基于Arduino的平衡车机械臂

两轮驱动机器人车与机械臂的DIY指南视频： 基于Arduino的平衡车机械臂资料下载链接引言在这篇文章中，我们将一起探索如何构建一个两轮驱动的机器人车，并配备有一个机器人臂，这个项目适合初学者，并且可以在动态环…

阅读更多...

【练习Day20】字符串变形

【练习Day20】字符串变形

链接：字符串变形_牛客题霸_牛客网方法一：双逆转（推荐使用） 思路： 将单词位置的反转，那肯定前后都是逆序，不如我们先将整个字符串反转，这样是不是单词的位置也就随之反转了。但是单…

阅读更多...

ip地址和网络号关系是什么

ip地址和网络号关系是什么

在浩瀚的网络世界中，每一个连接互联网的设备都需要一个独特的标识来确保数据的准确传输。这个标识就是IP地址。然而，在深入探索IP地址的同时，我们不得不提及一个与之紧密相关的概念——网络号。网络号与IP地址之间存在着怎样的联系与区别&…

阅读更多...

android 登录界面编写

android 登录界面编写

1、登录页面实现内容 1.实现使用两个EditText输入框输入用户名和密码。 2.使用CheckBox控件记住密码功能。 3.登录时候，验证用户名和密码是否为空。 4.当前CheckBox控件记住密码勾上时，使用SharedPreferences存储用户名和密码。 5.登录时候使用Prog…

阅读更多...

run postinstall error, please remove node_modules before retry!

run postinstall error, please remove node_modules before retry!

下载 node_modules 报错：run postinstall error, please remove node_modules before retry! 原因：node 版本出现错误，我的项目之前是在 12 下运行的。解决方法： 先卸载node_modules清除缓存将node版本切换到12重新下载即可

阅读更多...

Docker 安装禅道-21.2版本-外部数据库模式

Docker 安装禅道-21.2版本-外部数据库模式

Docker 安装系列 1、拉取最新版本（zentao 21.2） [rootTseng ~]# docker pull hub.zentao.net/app/zentao Using default tag: latest latest: Pulling from app/zentao 55ab1b300d4b: Pull complete 6b5749e5ef1d: Pull complete bdccb03403c1: Pul…

阅读更多...

visual studio 2022 c++使用教程

visual studio 2022 c++使用教程

介绍 c开发windows一般都是visual studio，linux一般是vscode，但vscode调试c不方便，所以很多情况都是2套代码，在windows上用vs开发方便，在转到linux。安装 1、官网下载vs2022企业版–选择桌面开发–安装位置–安装–…

阅读更多...

python学opencv|读取图像（十七）认识alpha通道

python学opencv|读取图像（十七）认识alpha通道

【1】引言前序学习进程中，我们已经掌握了RGB和HSV图像的通道拆分和合并，获得了很多意想不到的效果，相关链接包括且不限于： python学opencv|读取图像（十二）BGR图像转HSV图像-CSDN博客 python学opencv|读…

阅读更多...

设计模式--单例模式【创建型模式】

设计模式--单例模式【创建型模式】

设计模式的分类我们都知道有 23 种设计模式，这 23 种设计模式可分为如下三类： 创建型模式（5 种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7 种）&#xff1…

阅读更多...

neo4j 图表数据导入到 TuGraph

neo4j 图表数据导入到 TuGraph

neo4j 图表数据导入到 TuGraph 代码文件说明后文前言:近期在引入阿里的 TuGraph 图数据库，需要将原 neo4j 数据导入到新的 tugraph 数据库中。预期走csv文件导入导出，但因为格式和数据库设计问题，操作起来比较麻烦（可能是个人没…

阅读更多...

模具生产过程中的标签使用流程图

模具生产过程中的标签使用流程图

①NFC芯片嵌入周转筐，通过读卡器读取CK_Label_v3的数据，并将这些信息上传至服务器进行存储； ②服务器随后与客户的WMS（仓库管理系统）进行交互，记录和同步注塑机的原始数据； ③当周转筐内的模具…

阅读更多...

Linux线程同步

Linux线程同步

1 线程同步概念假设有有三个线程A,B,C，当前一个线程A对内存中的共享资源进行访问时，其它线程B，C都不可以对这块内存进行操作，直到线程A对这块内存访问完毕为止，B，C中的一个才能访问这块内存，剩…

阅读更多...

Vue与React：前端框架的巅峰对决

Vue与React：前端框架的巅峰对决

文章目录一、引言（一）前端框架发展现状简述二、Vue 与 React 框架概述（一）Vue.js 简介（二）React.js 简介三、开发效率对比（一）Vue 开发效率分析（二）React …

阅读更多...

项目管理工具Maven（一）

项目管理工具Maven（一）

Maven的概念什么是Maven 翻译为“专家”，“内行”Maven是跨平台的项目管理工具。主要服务于基于Java平台的项目构建，依赖管理和项目信息管理。什么是理想的项目构建？ 高度自动化，跨平台，可重用的组件，标准…

阅读更多...

【Prometheus 】【实战篇（五）】深入解析 Prometheus 监控指标类型：Counter、Gauge、Histogram 和 Summary

【Prometheus 】【实战篇（五）】深入解析 Prometheus 监控指标类型：Counter、Gauge、Histogram 和 Summary

Prometheus 提供了四种核心的指标类型，分别是 Counter（计数器）、Gauge（仪表）、Histogram（直方图）和 Summary（摘要）。这些指标类型在客户端库中有具体的使用说明&#xff…

阅读更多...

outlook smtp 发送邮件

outlook smtp 发送邮件

前提条件开通 app password 开通 smtp 服务 import smtplib from email.mime.multipart import MIMEMultipart from email.mime.text import MIMETextdef send_html_email_smtp(sender_email, sender_password, recipient_email, subject, html_content):# Create the messag…

阅读更多...

最新文章

推荐文章