开源,可商业化!性能比Stable Difusion强2.5倍

文生图平台Playground宣布开源Playground V2版本,允许商业化,用户通过文本就能生成3D、动漫、素描、朋克、暗黑等多种类型1024x1024图片,同时提供免费在线体验。

Playground V2是基于Stable Diffusion XL开发而成,还从Midjourney搜集了10个类别,每个类别包含3000个样本的高质量图片用于图文对齐

根据测试数据显示,在超过1000个文本提示中,Playground V2生成图片的受欢迎程度远远超过Stable Diffusion XL。

免费体验地址:https://playground.com/

开源地址:https://huggingface.co/playgroundai/playground-v2-1024px-aesthetic

图片

Playground V2是在Stable Diffusion XL基础上开发的,所以架构上二者几乎差不多。但其从Midjourney搜集的10个类别的高质量样本,在数据微调时发挥了关键作用。

Playground V2采用了更大参数的UNet作为主干模型,是之前Stable Diffusion模型的3倍。

同时额外添加了多个模块包括:基于Fourier特征编码的大小及裁剪坐标条件,用于控制生成图像中对象位置;

图片

基于多个宽高比的多宽高比训练,生成不同形状比例的图像;文本编码器方面使用CLIP ViT-L和OpenCLIP ViT-bigG的特征拼接。此外还采用了独立的细节增强网络来提升主模型生成图像的视觉质量。

图片

此外,考虑到真实图像分辨率及宽高比差异很大,研究人员为使模型适应不同宽高比的训练数据,收集了20种不同宽高比的数据,尽量保证像素数接近1024*1024,通过在训练时切换宽高比数据进行模型微调。

Playground V2生成的图片欣赏

Playground V2生成的图片在光线搭配、阴暗对比、还原文本描述、色彩等方面,都非常不错,无法使用Midjourney、DALL·E 3和Stable Difusion的小伙伴们可以试试。

蛇缠绕着女人,非常美丽,水粉画,电影风格,书法线条,黑暗,怪异,神秘,现代复古,丰富的深色,波西米亚风格。

图片

女孩和熊,复杂的皮毛和织物纹理,数字绘画、发光效果、超精细、戏剧性的灯光,女孩的表情令人回味。

图片

蛋糕卷和草莓,干净的白色背景,写实风格,3D效果

图片

超美味的牛排,电影效果,专业美食摄影,影棚灯光,影棚背景,广告摄影,复杂细节,超细致,超真实,8K超高清。

图片

盘子里盛满了色彩缤纷的寿司卷、天妇罗蔬菜和小碗里冒着热气的味噌汤。新鲜的鱼切片,视觉和气味令人陶醉。米醋、芥末酱、腌姜、酱油和绿茶,让每一口食物都更加美味。8K超高清,写实。

图片

戴黑帽子的女巫,穿着黑色连衣裙,巴洛克风格,时尚拍摄,微妙色调的背景,超级微距,,复杂逼真的细节,影棚效果,动态照片,专业照片,工作室摄影,8K超逼真,写实风格。

图片

灰色的外星人,呈现出不同色调的蛇皮纹理,融合了机器人颈部特征,超大迷人的眼睛反射着镜面全息效果,站在全息森林沼泽中,戴着有毛利金丝装饰的威尼斯铁面具,8K超高清。

图片

本文素材来源Playground官网,如有侵权请联系删除

END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/211924.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

台灯应该买什么样的才能护眼?学生护眼必备护眼台灯推荐

10月26日,教育部召开新闻发布会,介绍综合防控儿童青少年近视工作情况。全国综合防控儿童青少年近视工作联席会议机制办公室主任、教育部体育卫生与艺术教育司司长王登峰介绍,2018年全国儿童青少年的总体近视率53.6%,2019年总体近视…

1.2 C语言简介

一、为什么要讲C语言 C语言是编程界的长青藤,可以查看语言排名发现,虽然现在语言很多,但是C语言一直占有一定地址 来源网站:https://www.tiobe.com/tiobe-index/ 在系统、嵌入式、底层驱动等领域存在一定的唯一性(C语…

使用GPT-4V解决Pycharm设置问题

pycharm如何实现关联,用中文回答 在PyCharm中关联PDF文件类型,您可以按照以下步骤操作: 1. 打开PyCharm设置:点击菜单栏中的“File”(文件),然后选择“Settings”(设置)。…

【目标检测】进行实时检测计数时,在摄像头窗口显示实时计数个数

这里我是用我本地训练的基于yolov8环境的竹签计数模型,在打开摄像头窗口增加了实时计数显示的代码,可以直接运行,大家可以根据此代码进行修改,其底层原理时将检测出来的目标的个数显示了出来。 该项目链接:【目标检测…

SQL注入漏洞的检测及防御方法

SQL注入(SQL Injection)是一种广泛存在于Web应用程序中的严重安全漏洞,它允许攻击者在不得到授权的情况下访问、修改或删除数据库中的数据。这是一种常见的攻击方式,因此数据库开发者、Web开发者和安全专业人员需要了解它&#xf…

tomcat控制台中文信息显示乱码

问题现象 我的tomcat版本是10.1版本。 在cmd下启动tomcat,会新打开控制台输出窗口: 控制台窗口输出的中文信息是乱码: 问题原因 产生这个问题的原因是:控制台窗口的编码和输出到控制台窗口的日志信息编码不一致。 查看tomc…

【开发技能】-解决visio交叉线(跨线)交叉点弯曲问题

问题 平时工作中使用visio作图时,经常会遇到交叉线在相交时会形成一个弯曲弓形,这十分影响视图效果。可以采用下面的方法消除弓形。 方法 第一步:菜单栏--设计---连接线 第二步:选中这条交叉线---点击显示跨线 最终问题得到解决…

【Java】实现顺序表基本的操作(数据结构)

文章目录 前言顺序表1、打印顺序表2、增加元素3、在任意位置增加元素4、判断是否包含某个元素5、查找某个元素对于的位置6、获取任意位置的元素7、将任意位置的元素设为value8、删除第一次出现的关键字9、获取顺序表长度10、清空顺序表总结 前言 在了解顺序表之前我们要先了解…

编织魔法世界——计算机科学的奇幻之旅

文章目录 每日一句正能量前言为什么当初选择计算机行业计算机对自己人生道路的影响后记 每日一句正能量 人生就像赛跑,不在乎你是否第一个到达尽头,而在乎你有没有跑完全程。 前言 计算机是一个神奇的领域,它可以让人们创造出炫酷的虚拟世界…

gpt3、gpt2与gpt1区别

参考:深度学习:GPT1、GPT2、GPT-3_HanZee的博客-CSDN博客 Zero-shot Learning / One-shot Learning-CSDN博客 Zero-shot(零次学习)简介-CSDN博客 GPT-2 模型由多层单向transformer的解码器部分构成,本质上是自回归模型…

【Android】查看keystore的公钥和私钥

前言: 查看前准备好.keystore文件,安装并配置openssl、keytool。文件路径中不要有中文。 一、查看keystore的公钥: 1.从keystore中获取MD5证书 keytool -list -v -keystore gamekeyold.keystore 2.导出公钥文件 keytool -export -alias …

vue+echarts实现桑吉图的效果

前言: 在我们项目使用图形的情况下,桑吉图算是冷门的图形了,但是它可以实现我们对多级数据之间数据流向更好的展示的需求,比如,我们实际数据流向中,具有1对多,多对多的情况下,如果用…

IDEA加载阿里Java规范插件

IDEA加载阿里巴巴Java开发手册插件,在写代码的时候会自动扫描代码规范。 1、打开Settings 2、打开Plugins 3、搜索Alibaba Java Code Guidelines(XenoAmess TPM)插件,点击Install进行安装,然后重启IDE生效。 4、鼠标右…

多人聊天Java

服务端 import java.io.*; import java.net.*; import java.util.ArrayList; public class Server{public static ServerSocket server_socket;public static ArrayList<Socket> socketListnew ArrayList<Socket>(); public static void main(String []args){try{…

大数据可视化项目——基于Python豆瓣电影数据可视化分析系统的设计与实现

大数据可视化项目——基于Python豆瓣电影数据可视化分析系统的设计与实现 本项目旨在通过对豆瓣电影数据进行综合分析与可视化展示&#xff0c;构建一个基于Python的大数据可视化系统。通过数据爬取收集、清洗、分析豆瓣电影数据&#xff0c;我们提供了一个全面的电影信息平台…

系统思考与啤酒游戏经营沙盘

结束一家汽车零配件公司《系统思考与啤酒游戏经营沙盘》的内训课&#xff0c;4个小组基本上都有共同的心智模式&#xff0c;这也代表团队有一些集体的盲点。不仅仅对啤酒游戏经营沙盘做了复盘&#xff0c;同时也借用学员画出的系统环路图完成真实案例的研讨以及团队共识&#x…

宏工科技:电池装备高效交付“唯快不破”

面向TWh时代的锂电设备供应需求&#xff0c;锂电设备向标准化、模块化方向升级的趋势显现。 “近年来&#xff0c;宏工科技聚焦电池匀浆技术创新与规模化降本&#xff0c;通过电池匀浆工艺段的模块化探索与应用&#xff0c;从项目周期、成本、效率等多维度赋能电池前段制造高质…

Ubuntur编译ROS报错:error PCL requires C++14 or above

ubuntu20.04 编译ROS包 报错&#xff1a; error&#xff1a; PCL requires C14 or above&#xff1a; 修改Cmakelists.txt文件&#xff1a; set&#xff08;CMAKE_CXX_STANDARD 14&#xff09; 再次编译成功.

图纸加密防泄密软件排名

图纸作为企业的重要资产&#xff0c;如何保护其安全&#xff0c;防止泄密&#xff0c;成为了企业亟待解决的问题。而图纸加密防泄密软件&#xff0c;正是解决这一问题的有效工具。 一、图纸加密防泄密软件的重要性 图纸加密防泄密软件通过对图纸进行加密处理&#xff0c;使得只…

重估拼多多,TEMU带给拼多多的不止是市值增量

监制 | 何玺 排版 | 叶媛 谁也没有想到&#xff0c;中国电商的格局改变居然如此之快。 12月29日&#xff0c;拼多多市值超越多年雄踞国内电商头把交椅的阿里巴巴&#xff0c;成为美股市值最大中概股。从此时开始&#xff0c;中国电商开始“拼”时代。 拼多多凭什么能超越阿里…