AI 绘画 - 建筑绘图辅助设计之模型训练

前情提要

2023-06-18 周日 杭州 小雨

小记: 昨天搞的好累,10点左右就想着先躺一会儿,然后就睡过去了,很奇怪,如果进行 AI 绘画,晚上就会做很奇怪的梦,说不上来的那种感觉,就是莫名的不舒服。
人类到底是宇宙的一种偶然奇迹还是概率统计下的一种必然现象,不必要搞那么清楚,只要保持原始的生物欲望就可以了,往往好奇心是害死猫的最常规途径。

任务清单:
a. LORA 训练脚本;
b. 训练集选择;
c. 裁剪&打标;
d. 生成模型;

简介

LoRA的全称是LoRA: Low-Rank Adaptation of Large Language Models,可以理解为stable diffusion(SD)模型的一种插件,和hyper-network,controlNet一样,都是在不修改SD模型的前提下,利用少量数据训练出一种画风/IP/人物,实现定制化需求,所需的训练资源比训练SD模要小很多,非常适合社区使用者和个人开发者。LoRA最初应用于NLP领域,用于微调GPT-3等模型(也就是ChatGPT的前生)。由于GPT参数量超过千亿,训练成本太高,因此LoRA采用了一个办法,仅训练低秩矩阵(low rank matrics),使用时将LoRA模型的参数注入(inject)SD模型,从而改变SD模型的生成风格,或者为SD模型添加新的人物/IP。用数据公式表达如下,其中
是初始SD模型的参数(Weights),
为低秩矩阵也就是LoRA模型的参数,
代表被LORA模型影响后的最终SD模型参数。整个过程是一个简单的线性关系,可以认为是原SD模型叠加LORA模型后,得到一个全新效果的模型。

在著名的模型分享网站https://civitai.com/上,有大量的SD模型和LoRA模型,其中SD模型仅有2000个,剩下4万个基本都是LoRA等小模型。例如下图,水墨画和原神八重神子就是LoRA模型来实现特定的画风和人物IP。

应用实践

1. LORA 模型训练脚本

方式一: Dreambooth

Dreambooth 是一种使用少量图像来训练模型的方法,是一种基于深度学习的图像风格转换技术。它可以将一张图片的风格应用到另一张图片上,以生成新的图像,Dreambooth 的一个优点是它可以生成高质量的艺术作品,而无需用户具备专业艺术技能。

特点:

  • 模型文件很大,2-4GB
  • 适于训练人脸,宠物和物件
  • 使用时需要 加载模型
  • 可以进行模型融合,跟其他模型文件融合成新的模型
  • 本地训练时需要高显存,>=12GB
  • 推荐训练人物*画风

方式二: Lora

Lora是一种使用少量图像来训练模型的方法。与 Dreambooth 不同,LoRA 训练速度更快:当 Dreambooth 需要大约二十分钟才能运行并产生几个 GB 的模型时,LoRA 只需八分钟就能完成训练,并产生约 5MB 的模型,推荐使用kohya_ss GUI 进行lora训练。

特点:

  • 模型大小适中,8~140MB
  • 使用时只需要加载对应的lora模型,可以多个不同的(lora模型+权重)叠加使用
  • 可以进行lora模型其他模型的融合
  • 本地训练时需要显存适中,>=7GB
  • 推荐训练人物

** 下载地址 **
链接:https://pan.baidu.com/s/1xrsbVvpkkPs7dzJ3nY2yuQ
提取码:goat

# 下载项目到本地
git clone https://github.com/bmaltais/kohya_ss.git# 运行设置脚本
setup.bat   

2. 优秀训练集选择

** 参数 **
选择标准: 风格一致,统一;
训练集数量: 30张左右的图片(100以内,不然容易过拟合);

** 目标 **
自我假设: 我是一个 UI 设计师,我有一个比较中意的图标设计,但是居然收费,我只需要学习他的风格,然后定制类似的图标进行设计;
目标网站(挑选喜欢的图标): https://www.iconfont.cn

3. 裁剪&打标

** 参数 **
显卡: 8G及以上
图片尺寸: 512512/512768/768*768;
标签参数: 排除颜色或者特定限制性的词汇;

** 裁剪 **

图片源路径: F:\AILab\AI 绘画\图标训练集\icon\in-001
图片目标路径: F:\AILab\AI 绘画\图标训练集\icon\out-001

** 打标 **

输入目录: F:\AILab\AI 绘画\图标训练集\icon\out-001
输出目录: F:\AILab\AI 绘画\图标训练集\icon\out-001

4. 模型训练

** 训练集 **

训练图片路径   F:\AILab\AI 绘画\lora-scripts\train\001-icon\5_icon# 备注: 001-icon 训练图片的路径,可随意;5_icon,其中的数字表示每张图片训练的次数;

** 选定底模 **

训练底模: F:\AILab\AI 绘画\lora-scripts\sd-models
SD模型位置: F:\AILab\AI 绘画\sd-webui-aki-v4\models\Stable-diffusion\chilloutmix_NiPrunedFp32Fix.safetensors

** 训练参数 **

** 运行训练 **

5. 模型测试(鸡准测试)

** 参数配置 **

文生图描述: a man in a suit and bow tie <lora:vpc123-caixukun:1>
训练就绪的模型: vpc123-caixukun.safetensors
底模: chilloutmix_NiPrunedFp32Fix.safetensors
# 测试时,底模和 lora 最好配套,不然可能文不对题

生成图:

总结

AI 绘画界一大神器,蔡徐坤的鸡准测试,当代二次元的少年们就是这么直白的嘲讽不留任何情面的,测试的模型还是可以看到生成人物的风格特色的,不过也走了不少的弯路,底模和基于底模训练出来的 lora 模型需要配合使用,还有些底模是不包含图片特征的关键字的,所以人物和建筑模型训练时选择的模型是不同的,需要结合实际需要进行合理的选择与训练。

QA

问题一: 无脚本执行权限

无法加载文件 F:\AILab\AI 绘画\lora-scripts\train.ps1。未对文件 F:\AILab\AI 绘画\lora-scripts\train.ps1 进 行数字签名。无法在当前系统上运行该脚本。有关运行脚本和设置执行策略的详细信息,请参阅 https:/go.microsoft.com/fwlink/?Li nkID=135170 中的 about_Execution_Policies

# 开启脚本执行能力 
set-ExecutionPolicy RemoteSigned

问题二: 开启 python 环境变量设置失败
activate : 无法将“activate”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次。 所在位置 行:1 字符: 1

问题三: 缺少训练脚本依赖

处理办法:

cd F:\AILab\AI 绘画\lora-scripts\sd-scripts\
pip install -r .\requirements.txt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19010.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用Midjourney辅助建筑设计,常用的提示和使用效果展示(内附Midjourney提示词网站)

文章目录 一.Midjourney建筑设计的提示技巧1. prompt模板12.prompt模板2 二、著名建筑师为例1.Zaha Hadid&#xff08;扎哈哈迪德&#xff09;2.Ludwig Mies van der Rohe&#xff08;路德维希密斯凡德罗&#xff09;3.Renzo Piano&#xff08;皮亚诺&#xff09;4.Stefano Boe…

解药 or 毒药:ChatGPT辅助设计,规划师和建筑师要失业了吗?

​人工智能聊天机器人ChatGPT火爆全球&#xff0c; 规划师笔记也紧赶潮流&#xff0c;快速尝试&#xff0c; AI与设计发生碰撞&#xff0c; 会产生怎样的火花&#xff1f; 运用AI帮助写文案、作图、视频剪辑、游戏制作等等随着2021被称为元宇宙元年&#xff0c;近些年来AI在…

谈人工智能AI的崛起:是威胁人类的革命性变革?--元理先生

随着OpenAI推出ChatGPT后&#xff0c;全球都在疯狂的推进人工智能的发展进程&#xff0c;而人工智能的迅速发展和应用&#xff0c;使我们面临着一个前所未有的挑战&#xff1a;人工智能是否将威胁到人类工作岗位的存在&#xff1f;元理先生将与大家探讨人工智能可能对人类工作造…

欧盟又出手!这次盯上了AI

今年称之为AI大年&#xff0c;一点都不为过。一个ChatGPT就引爆了全球的AI产业&#xff0c;它就像一颗久旱逢甘霖的草木&#xff0c;野蛮生长着。 木秀于林&#xff0c;AI风头正盛。作为全球最活跃的经济联盟之一&#xff0c;欧盟毫无疑问地也盯上了AI这个大明星。欧盟委员会执…

冯·诺依曼发表《第一份草案》 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」&#xff0c;从过去看未来&#xff0c;从现在亦可以改变未来。 今天是 2023 年 6 月 30 日。在电影史上&#xff0c;电影发展中一个重要步骤是彩色电影于 1930 年左右引入市场&#xff0c;而在 1948 年的今天&#xff0c;梅兰芳主演中国第一…

web前端Vue项目搭建流程

Node.js安装教程 一、安装环境 node.js下载官网: nodejs官网. 二、安装步骤 1、双击安装包&#xff0c;一直点击下一步。 2、点击change按钮&#xff0c;更换到自己的指定安装位置&#xff0c;点击下一步&#xff08;不修改默认位置也是可以的 &#xff09;。 3、一直点击下一步…

ChatGPT搭建AI网站实战

1.概述 ChatGPT是一款基于GPT-3.5架构的大型语言模型&#xff0c;它能够进行自然语言处理和生成对话等任务。作为一款智能化的聊天机器人&#xff0c;ChatGPT有着广泛的应用场景&#xff0c;如在线客服、智能助手、个性化推荐等。今天笔者给大家分享一下如何使用ChatGPT的API模…

20230623百度 Vs Google,百度差在哪里?【喊话李彦宏:为中华造芯IC】

20230623百度 Vs Google&#xff0c;百度差在哪里&#xff1f; 2023/6/23 18:45 百度搜索&#xff1a;google PDK 【百度可以为未来长期投资什么】 https://blog.csdn.net/cf2SudS8x8F0v/article/details/126187739 人人皆可免费造芯&#xff1f;谷歌开源芯片计划已释放90nm、…

2023年网络安全趋势

数据安全越来越重要。 我国《数据安全法》提出“建立健全数据安全治理体系”&#xff0c;各地区部门均在探索和简历数据分类分级、重要数据识别与重点保护制度。 数据安全治理不仅是一系列技术应用或产品&#xff0c;更是包括组织构建、规范制定、技术支撑等要素共同完成数据…

大模型时代下的全新变革

大模型的技术突破为人类的技术视野撕开全新AI宇宙的一角&#xff0c;让人类立刻畅想万花筒般的未来。当相信成为一种力量&#xff0c;它将助推不可估量的飞跃发展。在九章云极DataCanvas新产品发布会上&#xff0c;九章云极DataCanvas公司董事长方磊从AI科技企业角度阐述了独到…

ChatGPT实践应用和大模型技术解析

点击蓝字 关注我们 关注并星标 从此不迷路 计算机视觉研究院 公众号ID&#xff5c;计算机视觉研究院 学习群&#xff5c;扫码在主页获取加入方式 计算机视觉研究院专栏 Column of Computer Vision Institute 从技术原理、实战、应用等多维角度&#xff0c;共同探讨ChatGPT和大模…

AI+人类,实现高效网络安全

导语 聊天机器人和生成式人工智能&#xff08;如 ChatGPT&#xff09;突然成为主流让很多人感到担忧。很多人开始担忧&#xff0c;人工智能取代人的时代已经到来。 幸运的是&#xff0c;事实并非如此。 更有可能的情况是&#xff0c;人类将与 AI 合作创建工作角色的混合模型。…

世优科技创始人纪智辉:数字人技术与应用场景

2023年3月25日&#xff0c;由映魅咨询主办的2023年迎新交流论坛在上海举行。在本次迎新论坛中&#xff0c;映魅咨询邀请了在教育科技领域、元宇宙人工智能领域以及出海服务领域的优秀企业代表和与会听众们进行了深入的分享探讨。 世优科技创始人兼CEO纪智辉出席了本次论坛的元…

ChatGPT背后模型被证实具有人类心智!斯坦福新研究炸了,知名学者:“这一天终于来了”...

‍‍ 丰色 萧箫 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT原来是拥有心智的&#xff1f;&#xff01; “原本认为是人类独有的心智理论&#xff08;Theory of Mind&#xff0c;ToM&#xff09;&#xff0c;已经出现在ChatGPT背后的AI模型上。” 这是来自斯坦福大学的…

广东小学计算机,广州11区电脑派位和小学对口直升表,你想知道的都在这里了!...

很多家长在购买学位房的时候&#xff0c;除了考虑到地段小学的教学质量&#xff0c;也会参考对口初中的实力如何。上了这个小学&#xff0c;孩子初中去哪儿呢&#xff1f;&#xff01; 科普目前&#xff0c;广州市公办小学升公办初中主要通过“电脑派位”和“对口直升”两大方式…

【微信小程序】粤语教学平台-粤言粤语

展示视频 粤言粤语小程序演示视频 1 项目简介 1.1 项目背景 1.1.1 创意来源 根据中共中央办公厅、国务院办公厅印发的《关于实施中华优秀传统文化传承发展工程的意见》&#xff0c;我小组计划开发一款推广中国部分地区传统文化的可广泛推广的软件。为紧贴国家计划在2025年前…

音乐标签修改 android,音乐标签修改(Star Music Tag Editor)

Star Music Tag Editor可以对你音乐当中的各种标签信息来进行修改&#xff0c;在某些音乐信息出现错误之时你能够利用这款软件来直接的进行改正&#xff0c;让你的标签信息变得更加的容易进行分类&#xff0c;如果你感兴趣的话就快来下载这款Star Music Tag Editor&#xff01;…

项目三:声乐盒(音节+音乐)实验

摘要&#xff1a; 本项目以AT89C52为基础&#xff0c;通过矩阵键盘实现7个基本音节的低、中、高音&#xff0c;并在数码管上加以显示&#xff0c;同时通过按键切换模式&#xff0c;不同模式可以播放不同的歌曲 一.主体思路 单片机控制蜂鸣器需要一定频率的方波信号&#xff0…

计算机中班音乐,【精品】中班音乐教案6篇

【精品】中班音乐教案6篇 作为一名无私奉献的老师&#xff0c;就难以避免地要准备教案&#xff0c;编写教案有利于我们科学、合理地支配课堂时间。教案应该怎么写呢&#xff1f;下面是小编为大家整理的中班音乐教案6篇&#xff0c;仅供参考&#xff0c;希望能够帮助到大家。 中…

在线绘图网站

https://www.freedgo.com/