如何在算家云搭建Omost(图像生成)

一、Omost介绍

GitHub - lllyasviel/Omost:你的图像快到了!

Omost 是一个将 LLM 的编码能力转换为图像生成(或更准确地说,图像合成)能力的项目。“O”代表“omni”多模态,象征着项目支持多种形式的输入与输出,而“most”则表达了项目致力于最大化挖掘 LLM 模型潜力的决心,力求从每一个细节中释放出最多的图像生成可能性。作为 ControlNet 作者倾力打造的创新项目,标志着图像生成技术的一次革命性飞跃。该项目巧妙地将大型语言模型(LLM)的强大编码能力转化为直观且高效的图像生成能力,为用户带来前所未有的创作体验。

1.核心功能

用户只需通过简单的语言或提示词描述他们想要的画面,虚拟画布代理便能理解并转化为相应的视觉指令代码,通过全局描述和局部描述来定义图像特征。随后,这些指令会被传输给特定的图像生成器,后者负责将代码转换为惟妙惟肖的图像。用户还可以通过交互式编辑更改描述,进行代码重新编写。

Omost 提供了 LLM 模型,这些模型将编写代码,以使用 Omost 的虚拟代理来组合图像视觉内容。这可以通过图像生成器的特定实现来呈现,以实际生成图像。目前,提供了3个基于 Llama3 和 Phi3 变体的预训练 LLM 模型。

所有模型都使用混合数据进行训练:(1)包括 Open-Images 在内的多个数据集的地面实况注释,(2)通过自动注释图像提取数据,(3)来自 DPO(直接偏好优化,“代码是否可以由 python 3.10 编译”作为直接偏好)的强化,以及 (4)来自 OpenAI GPT4o 多模态功能的少量调整数据。

2.作者展示的部分效果图

十九世纪一个衣衫褴褛的男人穿着一件破烂的夹克(随机种子 12345)

image.png

image.png

图片,岩浆男孩(随机种子 -1)

image.png

梦中的婚礼(随机种子 12345)

image.png

二、容器构建

1.选择主机和镜像

在“租用实例”页面进入应用社区,搜索 Omost,点击选择即可一键匹配镜像

1727146028780_image.png

image.png

选择 3060 及以上性能显卡,点击立即创建,即可创建实例

image.png

2.进入创建的实例

在“项目实例”页面点击对应实例的“WebShell”,进入终端操作页面

image.png

image.png

以下命令均在该页面进行:

· 打开Omost_CN-main项目文件

cd Omost_CN-main

· 激活虚拟环境omost

conda activate omost

· 指定端口,运行py文件

export GRADIO_SERVER_NAME=0.0.0.0
export GRADIO_SERVER_PORT=8080
python gradio_app.py

出现以下页面代表运行成功:

image.png

3. 开启外部访问获取访问链接

返回“项目实例”列表,选择并点击对应实例的“开放端口”操作。

选择并点击对应实例的“开放对外端口”-->“获取访问地址”操作。访问的网址就已经复制到剪切板。

image.png

4. 进入 webUI 界面后即可操作

将复制的访问网址复制到新网页即可开始 ui 界面的使用

由于需要反复在 GPU 内加载 LLM 和 SDXL 大模型,因此运行模型出图速度比较慢,用 RTX3060 显卡进行运行,时间大概在八分钟左右出图。

image.png

image.png

以上就是在算家云搭建 Omost的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击应用社区(suanjiayun.com) ,选择模型,一键开启 AI 之旅!

971a4f51b8f1c01ea3fc332bef04cbf.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/443698.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

设计模式:单例

一.什么是单例模式 单例模式是一种设计模式,指在整个程序生命周期中有且仅有一个实例的类。可以分为懒汉式以及饿汉式。 懒汉式:只有在类的实例被使用时才生成唯一实例。但是存在线程安全以及内存泄露的问题。可以节省系统资源。 饿汉式:程序…

腾讯云SDK 选择指引

音视频终端 SDK(腾讯云视立方)提供多种音视频场景下的终端 SDK,用户可结合自身场景需要选择相应的 SDK 进行下载。 如果您无法通过应用场景确定您需要的 SDK,可以进入 自定义 SDK 下载页,勾选您需要的功能&#xff0c…

Redis-缓存过期淘汰策略

缓存淘汰策略 生产上redis内存设置为多少 设置为最大内存的 3/4 redis 会占用物理机多少内存 默认大小是 0,64 位系统下表示不限制内存大小,32位系统表示 3G 如何设置修改redis内存大小 config get maxmemory 查看修改方式 配置文件 单位是字节 2.…

(八)Protues仿真STM32单片机GPIO驱动数码管

1,参考上篇,将LED点阵屏更换成数码管如下图 2,修改驱动函数,数组seg[14]前10个是0-9数字的编码,后四个是空格,点,横线,下划线 char seg_decode(char num)//数字解码 {const char se…

vue3中使用live2D

概述 本文将介绍如何在vue3项目中使用Live2D。 Live2D 介绍 Live2D 是什么 Live2D 是一种用于将二维图像转化为可动画三维模型的技术,主要应用于游戏、虚拟角色和互动应用中。它允许开发者通过对静态图像进行分层和建模,使角色在不同角度下能够进行流…

【Linux系统编程】第二十八弹---构建基础文件操作库与理解标准错误流(stderr)在C与C++中的应用

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】【Linux系统编程】 目录 1、封装简单的库 1.1、定义文件结构 1.2、打开文件 1.3、刷新缓冲区 1.4、写文件 1.5、关闭文件 1.6、各文件代码 2、s…

【element-tiptap】如何增加一个扩展项,为文字渲染颜色?

源码地址: https://github.com/Leecason/element-tiptap 可以看到,当前这个页面的文字,都是黑色的(除了链接) 酱紫有些单调,我喜欢五颜六色的。那么这篇文章就来看下菜单项里面如何增加一个颜色的扩展&…

k8s微服务

一 、什么是微服务 用控制器来完成集群的工作负载,那么应用如何暴漏出去?需要通过微服务暴漏出去后才能被访问 Service是一组提供相同服务的Pod对外开放的接口。 借助Service,应用可以实现服务发现和负载均衡。 service默认只支持4层负载均…

Springboot 整合 logback 日志框架

文章目录 整合 Logback 日志框架第一步:导入依赖第二步:导入配置(logback.xml)详解 使用(记录日志) 遇到问题一解决方案 整合 Logback 日志框架 第一步:导入依赖 (Springboot 会自己…

Squid + Stunnel 配置

环境: 亚马逊服务器一台:3.26.80.132 华为云服务器一台:122.59.52.68 客户机一台: Win11 实现的需求:客户机通过设置华为云代理,实现透过亚马逊服务器上网 一、亚马逊服务器 1、安装Squid https://bl…

python爬虫 - 深入requests模块

🌈个人主页:https://blog.csdn.net/2401_86688088?typeblog 🔥 系列专栏:https://blog.csdn.net/2401_86688088/category_12797772.html 目录 前言 一、下载网络文件 (一)基本步骤 (二&…

大模型部署-​Ollama+WebUI

Ollama(安装包和安装文档文末领取!) Ollama 简介 主要特点: 易于使用:它提供了一个简洁的界面和命令行工具,使得用户可以方便地管理和运行不同的大语言模型。 多种模型支持:可以运行多种开源…

介绍一款开源的 Modern GUI PySide6 / PyQt6的使用

首先附上大神的开源地址(自行克隆吧): https://github.com/Wanderson-Magalhaes/Modern_GUI_PyDracula_PySide6_or_PyQt6 步骤一:安装PySide6库 pip install PySide6 步骤二:运行main文件 python main.py 就得…

Windows 11 24H2版本有哪些新功能_Windows 11 24H2十四大新功能介绍

距离上次发布的23H2版本已经过去了一年时间,现在,Win 11的24H2版本终于等到了,微软已经全面公开发布Win11 24H2版本,版本号为26100.1742,此次官宣的版本包括了消费者版、商业版、LTSC 2024版等,各种语言版本…

python使用装饰器来统计函数被调用次数、格式化dict以及Python-smtplib邮件发送的IP name possibly forged问题解决

一、python调试:使用装饰器来统计函数被调用次数及格式化dict 喜欢调试的时候显示数据并显示一些其它的信息,比如区分是哪次调用的调试信息,比如友好的显示dict等相对复杂的数据类型,所以这里涉及到两个方面。一是统计函数被调用次…

【计算机网络】网络相关技术介绍

文章目录 NAT概述NAT的基本概念NAT的工作原理1. **基本NAT(静态NAT)**2. **动态NAT**3. **NAPT(网络地址端口转换,也称为PAT)** 底层实现原理1. **数据包处理**2. **转换表**3. **超时机制** NAT的优点NAT的缺点总结 P…

大模型微调十诫:关于将微调模型部署到生产环境的十条建议

转自NLP工程化 大模型微调十诫:关于将微调模型部署到生产环境的十条建议: (1)不要盲目微调模型,先尝试使用提示的方式满足需求。只有当提示无法达到质量、性能或成本目标时,才考虑微调。 (2&…

RabbitMQ延迟队列

1场景: 1.下单之后,给10分钟时间进行支付,如果10分钟后,没有支付,订单取消。(可以使用队列的ttl,因为所有的消息都是一样的停留时长10分钟) 2.定时发布文章(要求4月1号…

MPA-SVM多变量分类预测|海洋捕食者优化算法-支持向量机|Matalb

目录 一、程序及算法内容介绍: 基本内容: 亮点与优势: 二、实际运行效果: 三、算法介绍: 四、完整程序下载: 一、程序及算法内容介绍: 基本内容: 本代码基于Matlab平台编译&…

JavaScript 数组简单学习

目录 1. 数组 1.1 介绍 1.2 基本使用 1.2.1 声明语法 1.2.2 取值语法 1.2.3 术语 1.3 案例 1. 数组 1.1 介绍 1.2 基本使用 1.2.1 声明语法 1.2.2 取值语法 1.2.3 术语 1.3 案例