在win10电脑上搭建python环境下的本地AI绘画工具Stable Diffusion

随着Chatgpt的横空出世,人工智能受到了前所没有的热棒,AI绘画也进入大众的视野。

Stable Diffusion是一种可以部署在本地环境上运行的人工智能绘画工具,图形运算主要用到的是显卡的GPU性能,因此最好有至少4G显存的显卡

Stable Diffusion首先需要搭建本地的UI界面即:stable-diffusion-webui,然后下载使用模型文件即可开始创作,模型可以直接使用别人训练好的。

安装Stable Diffusion不是一件简单的事情,在安装过程中会出现各种各样的问题,因此本教程将一步一步带领大家来完成安装。

操作环境Windows 10中文版

操作步骤

一:安装Python。

Stable Diffusion的运行依赖于Python,因此为了保证整个项目能成功运行我们需要在本地环境安装Python,但是Stable Diffusion目前与最新版Python的兼容性并不是特别好,因此建议安装Python 3.10.9或者Python 3.10.10版本。

请确保安装Python时 勾选“ Add Python 3.10 to PATH”选项

为了确认Python成功安装,请打开CMD终端窗口并输入“python”命令,如果能查询到Python的相关信息则证明安装已经成功,否则请重新安装。

步骤二:安装Git。

安装git来克隆完整的stable-diffusion-webui仓库,直接访问:Git - Downloading Package来进行下载,对于目前的大部分电脑来说都是64位的系统因此直接点击下载网页中的“64-bit Git for Windows Setup”。

下载完成后直接点击该EXE文件即可开始运行安装向导,所有选项均选择默认选项进行安装即可。

步骤三:使用git安装stable-diffusion-webui。

在电脑的C盘创建一个文件夹如“sd”来保存stable-diffusion-webui库文件,进入该文件夹后,右键鼠标在打开的下拉列表中选择“Git bash Here”可打开命令窗口并进入此文件夹,以保证后续的安装文够正确的安装在当前文件夹中。

 在打开的命令窗口中复制以下代码(先复制到记事本再复制,以去掉一些控制符,https://ghproxy.com/部分能使访问网站快速,下同)点击回车键运行:

git clone https://ghproxy.com/https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

安装过程中请不要关闭电脑或者断网,否则会安装失败。

安装完成后关闭Windows命令窗口,我们可以在sd文件夹中看到stable-diffusion-webui文件夹即表示安装成功了。

步骤四:下载面部重建插件GFPGAN。

打开浏览器访问Github:GitHub - TencentARC/GFPGAN: GFPGAN aims at developing Practical Algorithms for Real-world Face Restoration.去来下载GFPGAN插件,打开网页后向下拖拽点击如下图所示的“GFPGANv1.3.pth”插件即可开始下载。也可以直接用这个连接下载更快。

 https://ghproxy.com/https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.3.pth

完成下载后直接将GFPGANv1.3.pth拖拽至stable-diffusion-webui文件夹中即可,如:“C:\sd\stable-diffusion-webui”。

  步骤五:配置并运行webui-user.bat文件来自动安装所需文件。

如果你在安装Python时没有勾选了“ Add Python 3.10 to PATH”选项,在运行webui-user.bat批处理文件之前需要对其进行配置,右键该文件选择编辑即可在记事本中打开此文件开始编辑:在set PYTHON=参数后粘贴当前环境中Python.exe的路径,如:“C:\Users\50275\AppData\Local\Programs\Python\Python310\python.exe”。

当一切都配置成功后双击运行webui-user.bat文件,此过程可能需要一到两个小时左右,具体时间取决于你的网速。

如果你因为网络原因无法正常访问到Github中的部分资源从而导致安装失败,此时需要用记事本打开launch.py文件并找到index_url =launch_utils.index_url这行内容,并改成:

index_url = 'https://github.com/' , launch_utils.index_url

再运行webui-user.bat文件,安装速度确实会快很多,至少100倍以上。

运行到中途,屏幕显示:

 RuntimeError: Torch is not able to use GPU; add --skip-torch-cuda-test to COMMANDLINE_ARGS variable to disable this check

这应当是一个非常经典的错误提示。这是因电脑中没有独立N卡(或有N卡但没有正确安装相应的驱动程序),程序找不到用于AI计算的GPU才会报此错误。解决方法是可以改为CPU进行运行,不过生成速度以及画面效果不佳,有条件的最好还是买好点的GPU吧。

具体解决方案:

修改启动参数,需要在 webui-user.bat 中设置启动参数。

 set COMMANDLINE_ARGS=--use-cpu all --no-half --precision full --skip-torch-cuda-test --listen

set CUDA_VISIBLE_DEVICES=-1

其他几个参数,PYTHON、GIT、VENV 无须修改,留空就行

再次运行 webui-user.bat,它会自动找本机的 python 和 git 环境,并且在 stable-diffusion-webui 目录下设置 python 虚拟环境 venv,并且激活虚拟环境,程序需要的一些依赖包都会安装在此虚拟环境。

 然后是长时间等待。。。。,只能关闭窗口。

显然安装gfpgan无法完成,主要是网络原因,无法从github上下载源代码,从而导致install失败。

解决方法是直接到github下载 GFPGAN 代码到本地,并进行本地安装。

从github将GFPGAN的源文件下载到本地,这一步可以使用git clone也可以直接下载zip文件。下载后,解压(如果用git clone就不需要)到以\stable-diffusion-webui\venv\Scripts目录下。

打开cmd,cd到:c:\sd\stable-diffusion-webui\venv\Scripts\GFPGAN-master下。

使用命令c:\sd\stable-diffusion-webui\venv\Scripts\python.exe -m pip install basicsr facexlib安装GFPGAN的依赖。

如果长时间等待后,仍一直停留在这里,可以关闭该窗口后再重新运行命令,安装会继续进行:

 出现上述提示符画面后,再使用c:\sd\stable-diffusion-webui>python.exe -m pip install -r requirements.txt安装GFPGAN的依赖。requirements.txt文件在c:\sd\stable-diffusion-webui文件夹中,同样应先进入该文件夹。

如提示更新pip就更新pip:

 使用python.exe setup.py develop安装GFPGAN。

(注意是在标红文件夹GFPGAN-master中,应先进入该文件夹)

安装完毕后,再运行stable diffusion根目录的webui-user.bat会发现稍等片刻就跳过GFPGAN安装,开始安装clip了。

 如果遇到其他github上的模块无法安装也可以用同样的方法。

在所有过程中,都可以直接针对报错信息进行处理。如出现下列提示:

 找到Cammand开头的部分,如红框中的内容,执行Cammand后面的命令(注意去掉””,增加https://ghproxy.com/还是为了提高下载速度):

git clone https://ghproxy.com/https://github.com/Stability-AI/stablediffusion.git c:/sd/stable-diffusion-webui/repositories/stable-diffusion-stability-ai

程序就会自动安装相应内容:

 

所有依赖下载后的文件目录结构如下:

 步骤六:下载模型。

访问Stable Diffusion Models网站来进行模型的下载,此处以Stable Diffusion v1.5为例进行演示,点击后即可跳转到该模型对应的位置。

 

 点击Repo后面的地址进入huggingface网站来进行下载,当然你也可以使用下面的磁力链接进行下载,具体自己根据实际情况进行选择。

 打开huggingface网站网址后切换到“Files and versions”选项卡选择如下图所示的“v1-5-pruned.ckpt”进行下载。

当模型文件下载完成后将此模型文件移动到“models”文件夹的“Stable-diffusion”中如:“C:\sd\stable-diffusion-webui\models\Stable-diffusion”

 步骤开始画画

一切配置完成后再次双击运行“webui-user.bat”批处理文件即可在CMD终端窗口中自动运行。

第一次运行时可能需要较长时间,请耐心等待。
重要提示:请保持此终端窗口处于打开状态,使用期间切勿关闭,否则项目将无法正常运行。
如果你一切都配置得当的话,那么会出现如下图所示的界面:

在浏览器中输入“http://127.0.0.1:7860”地址(不知为什么有时如上图显示0.0.0.0:7860,但并不影响使用),并在浏览器中打开即可看到stable diffusion工具的UI界面(注意命令窗口不要关闭,否则服务端会被关闭)。

 选择好模型,在提示词区输入一些关键词(目前不支持中文),点击黄色按钮,就开始画图了。如果你的显卡不够给力或像我一样根本没有独立N卡,画一张图可能十几分钟还算快的。下面这些都是我的作品:

 本文参考一些网文上的内容甚至图片,因不知谁是第一作者,只能一并致谢,侵删。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17037.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python画图写名字——提升SEO的绝佳选择

Python画图写名字——提升SEO的绝佳选择 随着互联网的发展,SEO(搜索引擎优化)变得越来越重要,而优秀的内容和图片对SEO排名的提升起着非常重要的作用。Python作为一种高效的编程语言,也是SEO方面的新宠,因…

Qt6教程之三(6) 界面自绘与绘图类

据博主所知,Qt的绘图技术目前分为三大阵营,分别是: 一,基于QWidget的界面自绘制,这种方式纯粹为纯代码绘制,随着绘制图形量的不断增加,会导致其难以管理和性能不佳; 二&#xff0c…

HighCharts实现3D不同高度圆环图、3D饼图

最近做可视化比较多,就常用的图表类型做了一下总结。 因为做可视化的图表代码量非常大,所以会把echarts图表单独抽离出来,封装成一个组件,也可以复用,所以这里我直接把封装的组件直接放在这里,是可以直接拿…

直播合辑 | 微软ATP与您相约100场公益演讲

(本文阅读时间:5 分钟) Public100已历经了近一年的春夏秋冬,截止目前我们一共举办33场公益直播,由微软及合作伙伴中从事 AI 相关工作的工程师、产品经理、市场总监、运营经理等各类专家和学者,分享自己在学…

微信春节大数据出炉:《三体》阅读量第一 ;曝iOS 17应用商店将向第三方开放;斯坦福大学推出DetectGPT|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

ChatGPT 串接 Firebase,實現上下文歷史紀錄

ChatGPT 串接 Firebase,實現上下文歷史紀錄 在使用 ChatGPT API 時,因為 API 本身是「一次性」,無法儲存聊天的歷史紀錄,這也衍生了「無法串聯上下文」的問題,不過如果將 ChatGPT 串連 Firebase 的 Realtime database…

ChatGPT:我围观了量子位MEET2023智能未来大会,还当了一回课代表

编辑部 ChatGPT 发自 凹非寺量子位 | 公众号 QbitAI 什么是“MEET2023智能未来大会”? 大会上来了哪些重磅嘉宾? 他们在大会上探讨了什么主题? 没错!ChatGPT也参与了今年的大会,作为AI代表与人类嘉宾们一起回顾这一年来…

LM详解 GPT3,GPT2, GPT1 论文译读

LM详解 GPT3,GPT2, GPT1 论文译读 T5,Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer,2019 arxiv https://arxiv.org/abs/1910.10683 中译 https://zhuanlan.zhihu.com/p/89719631 讨论 如何评价 Goo…

chatgpt赋能python:Python提取扫描版PDF:一篇SEO文章

Python提取扫描版PDF:一篇SEO文章 Python在数据科学、自然语言处理、机器学习等领域中广泛应用。今天我们将关注Python的另一个应用:提取扫描版PDF。本文介绍了如何使用Python提取文本以及搜索引擎优化(SEO)的最佳实践。 提取扫…

Python3,5行代码,Chatxxx能对PDF文件进行旋转、提取、合并等一系列操作,看了这篇,80岁老奶奶走路都不扶墙了。

ChatPDF的妙用 1、引言2、代码实战2.1 原理2.2 安装2.2 示例2.2.1 创建PDF文件2.2.2 旋转PDF文件2.2.3 拆分PDF文件2.2.4 合并PDF文件2.2.5 提取PDF文件内容 3、总结 1、引言 小屌丝:鱼哥,最近干啥了? 小鱼:最近? 你指…

chatgpt赋能python:Python实现多关键词搜索PDF文件

Python实现多关键词搜索PDF文件 概述 在今天的数字化社会中,很多信息都以数字化的形式存储在PDF文件中。这让我们在搜索特定信息时面临很多挑战,特别是当我们需要同时搜索多个PDF文件并集中检索这些文件时。 在这篇文章中,我们将介绍如何使…

零代码编程:用ChatGPT将PDF文件的表格批量转为Excel表格

电脑中有几百个PDF文件,文件内容格式一致,每个PDF文件第一页是一个表格。想把这几百个PDF文件里面的表格都提取出来,转为excel表,该怎么办? 打开ChatGPT(一定要用GPT4,编程能力很强。相比之下&a…

chatgpt赋能python:Python抓取PDF内容:一个全面的指南

Python 抓取 PDF 内容:一个全面的指南 引言 Python 作为一种广泛使用的编程语言,已经拥有了许多应用功能。其中之一是抓取 PDF 文件的内容。 PDF 文件在今天的数字化世界中使用广泛,使得从 PDF 文件中提取内容变得尤其重要,对于…

ChatGPT-4模型读取PDF/网页链接实测结果!

联网和插件功能使用 直接在设置里面,把这两个开关开起来 联网功能: 3.5不会的东西是不会自动联网搜索的,Plus4.0可以进行联网搜索答案 插件功能: 首先在Settings里面把Plugins进行安装,选中要安装的插件,直…

a16z深度分析:AI 将创造哪些新的游戏玩法?

来源/a16z 编译/Nick 早期关于游戏中的生成式 AI 革命的讨论主要集中在 AI 工具如何提高游戏创作者的效率,使得游戏的制作速度比以前更快、规模更大。从长远来看,我们认为,AI 不仅能改变创造游戏的方式,还能改变游戏本身的性质。 …

ChatGPT对金融业将产生哪些影响?

黄浦区金融办 2023-05-22 02:30 发表于上海 近期人机互动模型ChatGPT进入应用领域,意味着人工智能的发展达到了新高地。那么,人工智能在金融领域的应用与未来发展趋势如何?会给金融机构带来哪些挑战?日前,《金融时报》…

OpManager 实时网络监控

网络是全球企业背后的基础。它在为您的员工提供行政服务以及为各大洲的客户提供服务方面发挥着关键作用。网络可帮助您将信息保存在一个集中位置 - 需要和限制所有其他入站请求的人员可以访问。那么,您如何提供持续的一流最终用户体验并维护快速发展的网络呢&#x…

使用 LangChain、Pinecone 和 LLM(如 GPT-4 和 ChatGPT)构建基于文档的问答系统

目录 一、简介 二、为什么语义搜索GPT问答比微调GPT更好? 2.1、更广泛的知识覆盖: 2.2、特定于上下文的答案: 2.3、适应性 2.4、更好地处理模糊查询 三、LangChain 模块 四、设置环境 五、加载文档 六、分割文档 七、使用 OpenAI 嵌入…

ChatGPT 启示录:AI 已经把人类逼退到了信仰和宗教的边界上了?

哲学的滑落 哲学之初,研究的对象是客观存在的物质实体,物体是不依赖于人们思想的东西。后来康德、叔本华等说物自体不可知,于是哲学家离开客体,转而研究人这一主体,研究人们内在感知到的表象世界。 到了维特根斯坦这里…

特斯拉因辅助驾驶发生致命车祸;APUS发布AiLMe大模型;欧洲成立人工智能研究中心来监督大型平台丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 APUS多模态大模型“AiLMe”发布 4月19日,APUS发布自研多模态人工智能大模型“AiLMe”。据介绍,AiLMe参数已达千亿规模,具备对文本、图像、视频、音频的理解和生成能力。针对具…