Datawhale AI 夏令营 第四期 AIGC Task3

活动简介

活动链接:Datawhale AI 夏令营(第四期)
在这里插入图片描述
以及AIGC里面的本次任务说明:Task 3 进阶上分-实战优化
在这里插入图片描述
这次任务呢,主要是对知识的一个讲解,包括ComfyUI工具的使用啊,以及LoRA的原理啊,还有高质量数据集的准备技巧。这次干货满满,前两次任务主要是对实践流程的解读,这次呢是对背后原理的解释。
同样的,具体细节我就不赘述了,参看教程即可,下面我主要就此次Task3任务学到了哪些内容作一个总结。

个人总结

基础知识

首先来到第一部分:ComfyUI。这个工具我还真没用过,这是头一次见。我们简单地理解它就是一种图形用户界面(就像你的操作系统一样,你直接对电脑操作很复杂不好操作,但是通过操作系统的图形用户界面比如桌面,就很好控制电脑了),从而把你生成图像的流程变得非常简单。类似我原先用过的可视化编程工具WordPress,就是通过容易理解的图形化操作来帮我们做前端页面的(我以前用过它做网站,简单的网站像个人博客购、物网站都可以做)。关于ComfyUI的讲解呢,教程已经非常详细了,以及后面的实践部分也会涉及到。

其次是第二部分:LoRA,是十分有用的一部分。我在Task1的博客就说过,当年我在微调大语言模型的时候就涉及过LoRA,这次在图像模型居然也能用到,真的涨知识了。后来通过学习LoRA的原理明白它其实是一种思想,并不是固定用于语言模型的方法。我用我自己的话语说一说它吧(可能说得乱七八糟),它好像就是在原先模型参数的基础上加了两个向量B和A乘起来的矩阵参数,另外还有两个参数控制这个矩阵的规模(lora-rank)和权重(lora-alpha)。应该是在保持原先模型参数固有的泛化性的情况下,训练新引的这些参数,使模型对特定领域达到一个很好的效果。这个过程让我想起了经典三维工作PointNet中的T-Net模块,T-Net好像就是将原本的三维点云乘上一个矩阵,这个矩阵也需要训练,从而达到一个微调点云位置的效果。

最后是第三部分:关于数据集的技巧。这部分呢虽然相对好理解,但是是十分关键的,毕竟我们常说“没有不好的算法,只有不好的数据”,数据在我们实验中起到非常关键甚至是决定性的作用。最后这部分呢主要是教会我们如何去找数据(其实我们找到数据之后对数据的预处理也是十分关键的一步)。教程中例举了一些公开的数据平台,比较熟悉的就是ImageNet了,因为做图像相关的基本都拿它来跑分吧,还有现在常用的三维物体数据集ShapeNet也是十分出名,斯坦福真是数据集大户。然后我感触特别深刻的就是“数据合成”,因为当年我微调ChatGLM时,因为要用于特定的领域嘛,所以缺乏对应的数据集(当时也是先用的“爬虫获取”),于是当时是用ChatGPT合成的,当时还感觉先造数据再去造大模型很奇怪,没想到这次教程中也提到了。还有教程中提到的“数据增强”也是我以后打算研究的。

实践感受

实践部分呢,首先是ComfyUI的一个使用。下面是正确打开图形用户界面的一个截图:
在这里插入图片描述
当加载工作流之后生成图片的效果:
在这里插入图片描述
最后是加载LoRA工作流的效果:
在这里插入图片描述
这次实践部分呢,给我最大的感受就是,教程只是提供了众多工具中的一种,我们可以使用它,但更重要的的是去探索更多的工具,选择最适合自己的方法。

好啦!本次学习笔记就到这里啦,表述可能不是很专业,大家将就看啦~

本次夏令营呢就到此结束了,但我们的学习路程还远远没有结束,学无止境,我们一起加油!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/403347.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

学习记录第三十天

管道: 无名管道:只能用于亲缘关系进程之间的通信: 有名管道:是一种特殊的文件,存在于内存中,在系统中有对应的名称,文件大小为0字节; 编程: Linux系统中,…

Deepin-获取屏幕缩放比例

Deepin-获取屏幕缩放比例 一、概述二、实现代码 一、概述 环境:UOS、Deepin 我的目的是为了获取屏幕的缩放比例值,就是获取如下的值 我们可以去读取当前的环境变量值,在Qt Creator中可以看到这个值 二、实现代码 相关的Qt接口如下&…

串口通信协议(hal库)

目录 串口通信协议 串行/并行 同步/异步 单工/半双工/全双工 DR寄存器 轮询方式 中断方式 主要中断事件: DMA方式 USART 模块的常用 HAL 库常用接口函数 串口通信协议 串口通信(Serial Communication)指的是数据通过一个串行的通道…

前端如何使用Nginx代理dist网页,代理websocket,代理后端

本文将指导您如何配置Nginx以代理前后端分离的项目,并特别说明了对WebSocket的代理设置。通过本教程,您将能够实现一次性配置,进而使项目能够在任意局域网服务器上部署,并可通过IP地址或域名访问服务。 笔者建议 先速览本文了解大…

Java、python、php版的企业单位考勤打卡管理系统的设计与实现(源码、调试、LW、开题、PPT)

💕💕作者:计算机源码社 💕💕个人简介:本人 八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流&…

C语言-使用数组法,指针法实现将一个5X5的矩阵中最大的元素放在中心,四个角分别放四个最小的元素(顺序为从左到右,从上到下,从小到大存放),写一函数实现之。

1.题目要求: 将一个5X5的矩阵中最大的元素放在中心,四个角分别放四个最小的元素(顺序为从左到右,从上到下,从小到大存放),写一函数实现之。 2.数组法实现 #define _CRT_SECURE_NO_WARNINGS 1…

【自动驾驶】控制算法(一)绪论与前期准备

写在前面: 🌟 欢迎光临 清流君 的博客小天地,这里是我分享技术与心得的温馨角落。📝 个人主页:清流君_CSDN博客,期待与您一同探索 移动机器人 领域的无限可能。 🔍 本文系 清流君 原创之作&…

ROW_NUMBER(), RANK(), DENSE_RANK() SQL排序函数图文详解

ROW_NUMBER(), RANK(), DENSE_RANK() ROW_NUMBER(): 为结果集中的每一行分配唯一的连续编号。即使有重复的值,ROW_NUMBER() 也会为它们分配不同的序号。 SELECT column_name, ROW_NUMBER() OVER (ORDER BY column_name) AS row_num FROM table_name;2. RANK(): 对结…

2-68 基于matlab的小波分解子模式和盒维数的车型识别程序

基于matlab的小波分解子模式和盒维数的车型识别程序,可以选择不同车型,包括小车、中车、大车。GUI可视化界面操作,已包括多种图片。程序已调通,可直接运行。 2-68 小波分解子模式和盒维数 - 小红书 (xiaohongshu.com)

RabbitMQ实现多线程处理接收消息

前言:在使用RabbitListener注解来指定消费方法的时候,默认情况是单线程去监听队列,但是这个如果在高并发的场景中会出现很多个任务,但是每次只消费一个消息,就会很缓慢。单线程处理消息容易引起消息处理缓慢&#xff0…

深度学习(YOLO、DETR) 十折交叉验证

二:交叉验证 在 K 折验证之前最常用的验证方法就是交叉验证,即把数据划分为训练集、验证集和测试集。一般的划分比例为 7:1:2。但如何合理的抽取样本就成为了使用交叉验证的难点,不同的抽取方法会导致截然不同的训练性…

c语言学习,malloc()函数分析

1:malloc() 函数说明: 申请配置size大小内存空间 2:函数原型: void *malloc(size_t size) 3:函数参数: 参数size,为申请内存大小 4:返回值: 配置成功则返回指针&#…

Nginx实验

编译安装 Nginx 准备rhel9环境 下载安装包nginx-1.24.0(xftp)/复制下载链接 (nginx.org——>download) 解压 [rootnginx nginx-1.24.0]# tar zxf nginx-1.24.0.tar.gz [rootnginx nginx-1.24.0]#tar zxf nginx-1.24.0.tar.…

[掘金社区]自动签到脚本

直接上脚本 脚本临时写的,今天是运行的第一天,虽然报错编码,但是签到、抽奖都成功了。 下面是修改了之后的版本。 # -*- coding: utf-8 -*- import requests import logginglogging.basicConfig(levellogging.INFO)def check_sign_in_status(base_url,h…

Clobbering DOM attributes to bypass HTML filters

目录 寻找注入点 代码分析 payload构造 注入结果 寻找注入点 DOM破坏肯定是出现在js文件中,我们首先来看源码 /resources/labheader/js/labHeader.js这个源码没什么问题我们重点关注在下面两个源码上 /resources/js/loadCommentsWithHtmlJanitor.js这个源码中重…

STM32cubeMX配置Systick的bug

STM32cubeMX版本:6.11.0 现象 STM32cubeMX配置Systick的时钟,不管选择不分频 还是8分频。 生成的代码都是一样的,代码都是不分频。 即不管选择不分频还是8分频,Systick都是使用的系统时钟 函数调用 HAL_Init() → HAL_Init…

HarmonyOS开发案例:列表场景实例-TaskPool

介绍 本实例通过列表场景实例讲解,介绍在TaskPool线程中操作关系型数据库的方法,涵盖单条插入、批量插入、删除和查询操作。 效果图预览 使用说明 进入页面有insert(单条数据插入)、batch insert(批量数据插入)、query(查询操作)三个按钮,…

【安卓】播放多媒体文件

文章目录 播放音频播放视频 播放音频 在Android中播放音频文件一般是使用MediaPlayer类实现的,它对多种格式的音频文件提供了非常全面的控制方法,从而使播放音乐的工作变得十分简单。 MediaPlayer类中常用的控制方法。 常用方法名描述setDataSource()设…

使用html+css+js实现完整的登录注册页面

在这篇博客中,我们将讨论如何使用简单的 HTML 和 CSS 构建一个登录与注册页面。这个页面包含两个主要部分:登录界面和注册界面。我们还会展示如何通过 JavaScript 切换这两个部分的显示状态。 页面结构 我们将创建一个页面,其中包含两个主要…

CSS3-新特性

1.新增选择器 1.属性选择器 2.结构伪类选择器 3.伪元素选择器(重点) 4.CSS3 盒子模型 2.CSS3滤镜filter 3.CSS3 calc 函数 4.CSS3 过渡(重点)