保持角色一致性的绘本生成AI开源项目之Story-Adapter本地部署Windows篇

本文已首发:秋码记录

在人工智能领域,生成一致且连贯的故事绘本一直是一个具有挑战性的任务。Story-Adapter作为一个开源项目,旨在解决这一问题,为用户提供无需训练即可生成长篇故事视觉化的工具。本文将指导您如何在Windows系统上本地部署并运行Story-Adapter。

项目简介

Story-Adapter项目提出了一种无需训练的迭代框架,用于长篇故事的可视化生成,特别关注在生成过程中保持角色的一致性。通过利用现有的文本到图像生成模型,Story-Adapter能够根据输入的故事文本,生成一系列连贯且一致的图像帧,适用于绘本创作、动画制作等领域。

项目地址:https://github.com/UCSC-VLAA/story-adapter

环境准备

从项目的README.md中有关于本地安装的必要条件:

  • Python 3.10.14
  • PyTorch 2.2.2
  • CUDA 12.1
  • cuDNN 8.9.02

虽然官方是通过anaconda来创建python项目的虚拟环境,这也官方推荐的,可以说是所有开源AI 项目的友好方式。

然而我却不使用anaconda,而使用python自带创建虚拟环境的方式。

python -m venv story-adapter-env #创建 story-adapter-env 虚拟环境
cd story-adapter-env\Script
activate #激活虚拟环境
1. 安装Python

前往Python官方网站下载适用于Windows的最新版本Python安装包。在安装过程中,务必勾选“Add Python to PATH”选项,以便在命令提示符中直接使用Python命令。

我安装的是python 3.10.9

2.安装Git

访问Git for Windows下载并安装Git。安装完成后,您可以在命令提示符中使用git命令。

3.安装CUDA

如果您的计算机配备了NVIDIA GPU,并希望利用GPU加速,请前往NVIDIA官方网站下载并安装适用于您GPU型号的CUDA Toolkit。

在这里插入图片描述

在这里插入图片描述

克隆项目代码

执行以下命令以克隆Story-Adapter项目代码:

git clone https://github.com/UCSC-VLAA/story-adapter.git
cd story-adapter

此操作将在当前目录下创建一个名为story-adapter的文件夹,包含项目的所有代码。

安装依赖项

pip install-r requirements.txt-i https://pypi.tuna.tsinghua.edu.cn/simpe/

在这里插入图片描述

在这里插入图片描述

下载模型

在下载模型,请提前准备好网络(你应该懂的什么是网络吧)。

按照官方的指引来下载对应的模型,及存放的位置。

Download the checkpoint

  • downloading RealVisXL_V4.0 put it into “./RealVisXL_V4.0”

  • downloading clip_image_encoder put it into “./IP-Adapter/sdxl_models/image_encoder”

  • downloading ip-adapter_sdxl put it into “./IP-Adapter/sdxl_models/ip-adapter_sdxl.bin”

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

其他也是同样的操作哦,前提你得先设置好git网络哦,否则会下载不了哦。

等你模型下载好了之后,项目目录结构最终如下图所示。

在这里插入图片描述

在这里插入图片描述

运行项目

由于run.py文件已经配置好参数,所以我们就是用默认的,官方提供了6个故事prompt,我选择了第三个。

在这里插入图片描述

python run.py #也可以通过命令行参数进行传递, --story story4

在这里插入图片描述

会在当前项目根路径下自动创建story文件夹。

在这里插入图片描述

从这些图片可以看出,这是一个男人出海,不幸遇上风浪,被飘到原始森林,当然船只也坏了,而后他通过自己打造一只船,再次踏出海,索性的是,这回总算是回到了,日思夜想的故乡,与妻子相聚。在接下来的日子,他便将这段经历通过文字,记录了下来。或许是常年与大海打交道,身体终究还是抗不住那通风的折磨,住进了医院。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19082.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[JVM篇]垃圾回收器

垃圾回收器 Serial Seral Old PartNew CMS(Concurrent Mark Sweep) Parallel Scavenge Parallel Old G1 ZGC

字符串(典型算法思想)—— OJ例题算法解析思路

目录 一、14. 最长公共前缀 - 力扣(LeetCode) 解法一:算法代码(两两比较) 1. 初始化公共前缀 2. 遍历字符串数组 3. 辅助函数 findCommon 4. 返回最终结果 总结 解法二:算法代码(统一比较…

宝塔面板开始ssl后,使用域名访问不了后台管理

宝塔面板后台开启ssl访问后,用的证书是其他第三方颁发的证书 再使用 域名/xxx 的形式:https://域名:xxx/xxx 访问后台,结果出现如下,不管使用 http 还是 https 的路径访问都进不后台管理 这个时候可以使用 https://ip/xxx 的方式来…

java继承

1.继承的内存图 2.成员方法不能被继承 虚方法表满足:1.非static、2.非private、3.非final

通用知识库问答流程

总体流程,定义回调(函数执行完把回答的内容填充到数据库),使用封装的fastchat获取调用的模型, 根据向量数据库名,获取向量数据库实例 这是ssl 长连接的一种标准写法,首先写一个 生成器函数&…

WPS/Office使用其他LLM大语言模型作为AI助手

前言 WPS也有内置的AI,叫灵犀,但只能说是属于“能用,有好过无”,所以我一直在找能否在WPS上用上其他的LLM大语言模型,比如目前最火的DeepSeek,结论是:安装OfficeAI助手,就能在WPS上用…

亲测有效!使用Ollama本地部署DeepSeekR1模型,指定目录安装并实现可视化聊天与接口调用

文章目录 一、引言二、准备工作(Ollama 工具介绍与下载)2.1 Ollama介绍2.2 Ollama安装 三、指定目录安装 DeepSeek R1四、Chatbox 可视化聊天搭建4.1 Chatbox下载安装4.2 关联 DeepSeek R1 与 Chatbox 的步骤 五、使用 Ollama 调用 DeepSeek 接口5.1 请求…

4.SpringSecurity在分布式环境下的使用

参考 来源于黑马程序员: 手把手教你精通新版SpringSecurity 分布式认证概念说明 分布式认证,即我们常说的单点登录,简称SSO,指的是在多应用系统的项目中,用户只需要登录一次,就可以访 问所有互相信任的应…

傅里叶公式推导(五)

文章目录 从离散到连续回顾第四章F(w) 从离散到连续 回顾第四章 在周期 T, 傅里叶变换公式 f ( t ) ( t T ) f ( t ) ∑ n − ∞ ∞ C n e i n Δ w t C n 1 T ∫ 0 T f ( t ) e − i n Δ w t d t 式1 f(t)(tT) \\ f(t) \sum_{n-\infty}^{\infty }C_ne^{i…

VS Code User和System版区别【推荐使用System版本】and VSCode+Keil协同开发之Keil Assistant

VS Code User和System版区别 Chapter1 VS Code User和System版区别1. 对于安装而言2. 结束语 Chapter2 VS Code 安装、配置教程及插件推荐插件: Chapter3 VSCodeKeil协同开发之Keil Assistant1. 效果展示2. Keil Assistant简介3. Keil Assistant功能特性4. 部署步骤…

Python----Python高级(网络编程:网络高级:多播和广播,C/S架构,TCP,UDP,网络编程)

一、多播和广播 1.1、多播 1.1.1、定义 多播(Multicast)也称为组播,是一种一对多的通信方式,将信息从单个源发送到 多个特定的接收者。这些接收者组成一个特定的多播组,只有加入该组的设备才会接 收和处理多播数据。…

网络工程师 (41)IP协议、IP地址表示方法

一、IP协议 IP协议,全称网际互连协议(Internet Protocol),是TCP/IP体系中的网络层协议。 寻址:IP协议通过IP地址来唯一标识网络上的每一台设备,确保数据能够准确地发送到目标主机。路由选择:IP协…

Kubernetes控制平面组件:etcd高可用集群搭建

云原生学习路线导航页(持续更新中) kubernetes学习系列快捷链接 Kubernetes架构原则和对象设计(一)Kubernetes架构原则和对象设计(二)Kubernetes架构原则和对象设计(三)Kubernetes控…

Banana Pi OpenWRT One 官方路由器的第一印象

OpenWRT One是OpenWRT开源社区推出的首款官方开发板,与Banana Pi社区共同设计,由Banana Pi制造和发行。路由器采用蓝色铝合金外壳,质感极佳,视觉效果远超宣传图。整体设计简洁,呈长方形,虽然不是特别时尚&a…

【每日一题 | 2025】2.10 ~ 2.16

个人主页:Guiat 归属专栏:每日一题 文章目录 1. 【2.10】P8707 [蓝桥杯 2020 省 AB1] 走方格2. 【2.11】P8742 [蓝桥杯 2021 省 AB] 砝码称重3. 【2.12】P8786 [蓝桥杯 2022 省 B] 李白打酒加强版4. 【2.13】P8725 [蓝桥杯 2020 省 AB3] 画中漂流5. 【2.…

微信小程序配置3 配置sass

1. 在config。json文件里面的setting配置“sass” 2. 改你需要的页面后缀名为scss。 3.查看页面即可看到样式。

撕碎QT面具(1):Tab Widget转到某个Tab页

笔者未系统学过C语法,仅有Java基础,具体写法仿照于大模型以及其它博客。自我感觉,如果会一门对象语言,没必要先刻意学C,因为自己具有对象语言的基础,等需要用什么再学也不迟。毕竟不是专门学C去搞算法。 1…

恩智浦:将开发文档迁移到DITA/XML

摘要:本文是德国同行Parson公司写的一篇文章,描述芯片巨头恩智浦编写文档方法如何从MS Word和Adobe Frame Maker转向基于DITA的结构化写作和发布。英文原文地址:https://www.parson-europe.com/en/references/nxp - 1 - 项目目标 在开发产…

基于SpringBoot的医院药房管理系统【源码+答辩PPT++项目部署】高质量论文1-1.5W字

作者简介:✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流。✌ 主要内容:🌟Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能…

计算机性能与网络体系结构探讨 —— 基于《计算机网络》谢希仁第八版

(꒪ꇴ꒪ ),Hello我是祐言QAQ我的博客主页:C/C语言,数据结构,Linux基础,ARM开发板,网络编程等领域UP🌍快上🚘,一起学习,让我们成为一个强大的攻城狮&#xff0…