Datawhale X 魔搭 AI夏令营第四期-魔搭生图task1学习笔记

根据教程提供的链接,进入相应文章了解魔搭生图的主要工作是通过对大量图片的训练,生成自己的模型,然后使用不同的正向、反向提示词使模型输出对应的图片

1.官方跑baseline教程链接:Task 1 从零入门AI生图原理&实践

2.简单列举一下赛事的要求以及任务

  1. 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格......

  2. 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度及连贯性

 下面详细展示一下,跑baseline的每一步操作

1.开通阿里云交互式建模PAI-DSW

阿里云免费试用 - 阿里云

9ec67b5df7ab495380ad8c91a5410871.png247c2a01de954915847280e5036f2066.png

                4218d90ef0b0467cabb6611677cbfb60.png

2.在魔塔社区进行授权:

https://www.modelscope.cn/my/mynotebook/authorization

5cdd5c9f11574c22a053cd7d1d1781e9.png3104924f7c1248c2980527e7357d5262.pngf75a64b2a0734e1884707f29df4fd367.pngfa308b2164d1423b9873073dc4956429.png

上面的过程图片是取自官方链接,由于个人在操作过程中并没有及时保存,所以将官方图片放置在这里记录一下操作过程

授权成功,选择我的notebook->魔塔平台免费实例->方式二

这里阐明一下选择方式二的原因:新手一定要按教程走,不要自己去尝试在本地跑,我当时拿到任务后就想着是需要在自己电脑上搭建环境再把代码一行行敲进去跑,先使用git把库clone了下来,然后使用pycharm去安装需要的几个包,其中data-juicer这个东西就装了几个小时一直提示包名不对。后来放弃了本地,使用这个平台选了方式一,运行!pip命令下载data-juicer就会出错

解决了安装data-juicer出错之后又在后期使用data-juicer时说没有这个包,折腾了好几个小时都不行,每次到那个地方就会出错。解决了包的问题,后期又在加载模型时,出现“RuntimeError: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU”错误   。根据经验,建议选择方式二(血的教训),不过也是我这个小白第一次接触这种工具出现的问题,佬们多担待

ecb123a22ace4a3781bd00892b88c945.png

选择之后,点击启动

0d106bad246c4e5fb97e72207b34703c.png

ec561776d3334c9fb5660035df5484b0.png

选择终端,先使用git命令将我们需要的库下载下来

0525c5325eb340109cf9783cda7a1222.png

git lfs install
git clone https://www.modelscope.cn/datasets/maochase/kolors.git

上面的这两行命令可以一起复制粘贴之后运行:

acf02aa66e5b4964a2fcaea3300fddf6.png

再次出现rootxxxxxx这个用户名就代表下载成功:

34e6f95293ec4b23819054cf4f0b8881.png

左侧菜单栏出现kolors这个文件夹,打开kolors文件夹->baseline.ipynb

834cbdfce51f4b748bc51fcb665c70db.png

选择kernel

ea9388ac9950474d90ebb1d14ac7439a.png

重启一下内核,红色和绿色两种方式都可以

0433d83a3d9d431abab95881528ce211.png

e9ae46670dc445d7aa137616983a5b48.png

开始跑代码:

如果小伙伴们运行顺利的话,直接点击重启内核那个弯曲箭头->双箭头叠加,之后就可以静等代码运行,运行完成就得到了结果

但是我还是那个bug频出的小白,总结下来就是先把第一块pip的所有包安装完成

30aef2346fd14aae9fa1423b425da313.png

 在运行第二块代码之前,手动重置一下内核,之后一直点击,使其运行到最后一行,每一块我都进行了好多次,因为开始几次没有注意每一块的输出,导致到后面出错不知道该怎么办,所以下面给出我每一块运行的结果图片,不一样及时找错误,看是包没下好多下几次,第二步之前重置内核没有(很重要)

执行下载数据集完成后,左侧新增了一个data文件夹

d9b311fb806641f0b79006004308f34f.png

执行处理数据集代码完成:

f3f9bde1808f48bc8402b16c9232a092.png

保存数据集:

9f98a9b8332d4ddba700bcac84771ca3.png

下载模型:

7b66c333c8a34728a71f16f8a27fa878.png开始训练:

 383a12d522904fd4aceac26b79f063cf.png

加载模型:

每次出错都在这个地方,可能就是因为第二步那里的重启内核问题

红线那一行代码出来之后,就出现了CUDA的这个错误

d6ac568f9ee24ce4bd4fef74a78e3276.png

b72aa67f67d442aa80f9ccbfd42de623.png

最后根据描述输出对应图片基本上没有出错,结果成功输出:

4fad5c38153e4403b5a592048d8fc943.png

总结一下,可能就是一开始只是按照自己的想法走没有严格按教程,所以过程出现了很多问题

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/396687.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MongoDB教程

目录 介绍启动命令命令行操作常用命令总结MongoDB Compass 介绍 MongoDB是一个基于分布式文件存储的开源数据库系统,由C语言编写,旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB将数据存储为一个文档,数据结构由键值对组成&…

ibis:极具潜力的Python数据分析新框架

今天要给大家介绍的Python框架叫做ibis,没错,跟著名连锁酒店宜必思同名,其作者是创造了pandas、Arrow等著名框架的Wes McKinney。 ibis的核心理念是用同一套数据框操作API,统一操纵各种主流的数据运算框架,使得用户可以…

Ubuntu安装 IDEA

一、在官网下载 IDEA 下载IDEA For LinuxDownload the latest version of IntelliJ IDEA for Windows, macOS or Linux.https://www.jetbrains.com/idea/download/?sectionlinux下载好的安装包解压到/opt/中,目录名更改为 idea 二、对/opt/idea 目录下所有文件授予…

canal监听mysql增量数据发布到rabbitmq

canal工作原理 canal 依靠mysql主从备份的原理,模拟 MySQL slave 的交互协议,伪装自己为 MySQL slave ,向 MySQL master 发送dump 协议MySQL master 收到 dump 请求,开始推送 binary log 给 slave (即 canal )canal 解析 binary …

C++11右值引用

什么是左值,什么是右值? 不可以单纯字面去理解,等号左边是左值,等号右边是右值。 左值:可以修改的可以认为是左值,左值通常是变量。 右值:通常是常量,表达式或函数返回值&#xff0…

浅谈C/C++指针和引用在Linux和Windows不同环境下的编码风格

目录 0. 前言 1. 代码块、函数体上的 { } 的规范 2. 指针和引用中的 * 和 & 符号的位置 1. Linux 环境下编码风格(gcc) 2. Windows 环境下编码风格(Visual Studio) 3. 简单总结 0. 前言 C/C因为高度的自由性,并没有对一些常见的编码风格进行限制&#…

Hive3:数据的加载与导出

一、加载数据 在创建表之后,表中没有数据,我们不可能insert存入数据。 而是,通过数据加载,将HDFS中的数据关联到Hive表中。 建表 CREATE TABLE myhive.test_load(dt string comment 时间(时分秒), user_…

某客户ODS数据库undo段问题分析处理

概述 ODS数据库在7月22日4个时间点02:03,05:17,07:04,08:53分别报如下错误: 原因分析 Ora-1628:max # extents 32765 reached for rollback segment _SYSSMU19990_761259507$ Oracle 官方解释: Cause: An attempt was made to extend a roll…

VScode:前端项目中导出和导入插件

# 终端运行:导出扩展插件到指定路径(txt) code --list-extensions > C:\Users\UserName\Documents\extensions.txt # 终端运行:导入指定路径(txt)的扩展插件 Get-Content C:\Users\UserName\Documen…

渗透测试实战-菠菜站渗透测试(Nacos反序列化漏洞利用)

免责声明:文章来源于真实渗透测试,已获得授权,且关键信息已经打码处理,请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使用者本…

Python 设计模式之工厂函数模式

文章目录 案例基本案例逐渐复杂的案例 问题回顾什么是工厂模式?为什么会用到工厂函数模式?工厂函数模式和抽象工厂模式有什么关系? 工厂函数模式是一种创建型设计模式,抛出问题: 什么是工厂函数模式?为什么…

uniapp版本更新除了plus.runtime.getProperty的解决办法

以下是展示图 带尺寸的图片: 首先把以下代码放到想要更新弹出的页面 //template部分<uni-popup ref"popup" background-color"#fff"><versionUp handleCloseVersion"closeVersion"></versionUp></uni-popup>//script…

应急响应:Windows 入侵排查思路.

什么是应急响应. 一个组织为了 应对 各种网络安全意外事件的发生 所做的准备 以及在 事件发生后 所采取的措施 。说白了就是别人攻击你了&#xff0c;你怎么把这个攻击还原&#xff0c;看看别人是怎么攻击的&#xff0c;然后你如何去处理&#xff0c;这就是应急响应。 目录&am…

上海电信万兆宽带2026年将实现全城覆盖

为了响应号召&#xff0c;上海力争到2026年&#xff0c;初步建成以5G-A和万兆光网为标志的全球双万兆城市。上海电信正式对外宣布将于8月30日正式上线“美好家万兆融合套餐”&#xff0c;同时发布速率行业领先的“5G-A套餐”&#xff0c;上线“随翼选”云翼智选礼包&#xff0c…

【Go】手写简易go webserver

核心&#xff1a;实现net/http库中handler接口的ServeHTTP方法的实例&#xff0c;通过http.ListenAndServe注册后&#xff0c;所有的请求都会打到该实例的ServeHTTP方法里。Context是对请求对象和响应对象的封装&#xff0c;实现了获取请问请求参数、设置状态码、设置响应头、设…

WINDOWS核心编程-----3章,内核对象,是现在不同账号下测试

系列文章目录 终端服务命名空间中内核对象的测试程序 TerminalService程序需要用登录不同的windows账号同时运行。才能看出效果 建议测试流程 1&#xff0c;先登录windows账号A&#xff0c;运行两个本程序实例 2&#xff0c;保持上述两个实例人在运行中&#xff0c;在登陆wind…

Vue3 搭建前端工程,并使用idea配置项目启动

1 下载node.js 先下载 node.js LTS 并安装&#xff1a;node.js 的 npm&#xff0c;用于管理前端项目包依赖&#xff0c;这里以 14.17.3 这个版本为例。如果已经安装过 node.js&#xff0c;可以在设置中找到应用&#xff0c;点进去搜索 node.js 即可卸载 node.js 14.17.3 安装…

C语言典型例题32

《C程序设计教程&#xff08;第四版&#xff09;——谭浩强》 习题2.9 编程序用getchar函数读入两个字符给c1&#xff0c;c2&#xff0c;然后分别用putchar函数和printf函数输出这两个字符。 &#xff08;1&#xff09;变量c1&#xff0c;c2应该定义为字符型或者整型吗&#x…

Flutter 学习之旅

本文只针对个人学习所遇问题&#xff0c;以及解决方案进行记录&#xff0c;不深刨原理。 不深刨原理是因为我也才开始学习&#xff0c;讲不明白&#xff0c;有可能还误导大家 &#xff0c;希望多多包涵。 问题一&#xff1a; 如何通过appBar去设置状态栏字体颜色以及状态栏透…

LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式 与 Llama 3.1)

欢迎关注我的CSDN&#xff1a;https://spike.blog.csdn.net/ 本文地址&#xff1a;https://spike.blog.csdn.net/article/details/141028040 免责声明&#xff1a;本文来源于个人知识与公开资料&#xff0c;仅用于学术交流&#xff0c;欢迎讨论&#xff0c;不支持转载。 Ollama…