最强文生图模型Stable Diffusion 3 Medium 正式开源

最强文生图模型Stable Diffusion 3 Medium 正式开源

news/2025/1/10 1:40:28/文章来源:https://blog.csdn.net/ejinxian/article/details/140072681

Stability AI 宣布 Stable Diffusion 3 Medium 现已开源，是 Stable Diffusion 3 系列中最新、最先进的文本生成图像 AI 模型 —— 官方声称是 “迄今为止最先进的开源模型”，其性能甚至超过了 Midjourney 6。

Stable Diffusion 3 Medium 模型规格参数达到了 20 亿，可以给用户带来更真实的图片体验。目前用户可以从 Hugging Face 上下载该模型。

SD3 Medium 可以根据用户输入的文本描述，重点克服了文生图模型中手部和脸部的挑战，生成足以乱真的的图像。SD3 Medium 还利用其底层的 Diffusion Transformer 架构，高精度地整合了文字元素

SD3 Medium 的另一个特点是易于使用。相比较一些资源密集型 AI 模型，SD3 Medium 可以在消费级显卡上运行，可以加速普及适配。

Stability AI 表示，Stable Diffusion 3 Medium 代表了生成式人工智能发展的一个重要里程碑，并延续了 Stability AI 致力于使这项强大技术民主化的承诺。

模型：

来源：

Stable Diffusion 3 Medium — Stability AI

Serverless API - Gitee AI

stabilityai/stable-diffusion-3-medium - Gitee AI

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/364953.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【鸿蒙学习笔记】位置设置

【鸿蒙学习笔记】位置设置

官方文档：位置设置目录标题 align：子元素的对齐方式direction：官方文档没懂，看图理解吧 align：子元素的对齐方式 Stack() {Text(TopStart)}.width(90%).height(50).backgroundColor(0xFFE4C4).align(Alignment.TopS…

阅读更多...

Spring+Vue集成AOP系统日志

Spring+Vue集成AOP系统日志

新建logs表添加aop依赖  <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-aop</artifactId> </dependency> 新建获取ip地址工具类 import javax.servlet.http.H…

阅读更多...

昇思25天学习打卡营第12天|ShuffleNet图像分类

昇思25天学习打卡营第12天|ShuffleNet图像分类

1. 学习内容复盘 ShuffleNet网络介绍 ShuffleNetV1是旷视科技提出的一种计算高效的CNN模型，和MobileNet, SqueezeNet等一样主要应用在移动端，所以模型的设计目标就是利用有限的计算资源来达到最好的模型精度。ShuffleNetV1的设计核心是引入了两种操作&a…

阅读更多...

自然语言处理:第三十八章: 开箱即用的SOTA时间序列大模型 -Timsfm

自然语言处理:第三十八章: 开箱即用的SOTA时间序列大模型 -Timsfm

自然语言处理:第三十八章: 开箱即用的SOTA时间序列大模型 -Timsfm 文章链接:[2310.10688] A decoder-only foundation model for time-series forecasting (arxiv.org) 项目链接: google-research/timesfm: TimesFM (Time Series Foundation Model) is a pretrained time-ser…

阅读更多...

【FFmpeg】avformat_alloc_output_context2函数

【FFmpeg】avformat_alloc_output_context2函数

【FFmpeg】avformat_alloc_output_context2函数 1.avformat_alloc_output_context21.1 初始化AVFormatContext（avformat_alloc_context）1.2 格式猜测（av_guess_format）1.2.1 遍历可用的fmt（av_muxer_iterate&#xff0…

阅读更多...

C : 线性规划例题求解

C : 线性规划例题求解

Submit Page TestData Time Limit: 1 Sec Memory Limit: 128 Mb Submitted: 93 Solved: 49 Description 求解下述线性规划模型的最优值min �1�1�2�2�3�3�.�. &…

阅读更多...

【SkiaSharp绘图13】SKCanvas方法详解(二)填充颜色、封装对象、高性能绘制、点(集)(多段)线、圆角矩形、Surface、沿路径绘制文字

【SkiaSharp绘图13】SKCanvas方法详解(二)填充颜色、封装对象、高性能绘制、点(集)(多段)线、圆角矩形、Surface、沿路径绘制文字

文章目录 SKCanvas方法DrawColor 填充颜色DrawDrawable 绘制封装对象DrawImage 高性能绘制图像SKBitmap与SKImage对比DrawPicture 绘制图像SKPicture DrawPoint / DrawPoints 绘制点DrawRoundRect/DrawRoundRectDifference绘制圆角矩形DrawSurface 绘制SurfaceDrawTextOnPath沿…

阅读更多...

Android - 利用 jitpack 免费发布闭源 aar

Android - 利用 jitpack 免费发布闭源 aar

一、简述目前（Android/java） library 的主要发布仓库有 MavenCentral 和 jitpack，我之前也对这两种仓库的发布流程做了详细介绍：发布至 MavenCentral: https://juejin.cn/post/6953598441817636900发布至 jitpack: https://juejin.cn/post/7040733114506674183#heading-…

阅读更多...

C# 入门—实现 Hello, World!

C# 入门—实现 Hello, World!

目录一、.net 平台与.NET Framework框架 .NET Framework的构成 CLR：公共语言运行库 FCL：框架类库 WinForms ASP.NET ADO.NET WPF WCF WF LINQ Entity Framework Parallel LINQ 二、.net 能干什么 .net 两种交互模式 .net 能干什么 .net …

阅读更多...

优化模型验证30：多车场车辆路径问题模型及Gurobipy验证

优化模型验证30：多车场车辆路径问题模型及Gurobipy验证

目录 1 数学模型 1.1 用到的符号集合 1.2 模型公式 2 模型验证代码 2.1 Gurobipy代码 2.2 结果可视化多车场车辆路径问题的定义：大型的物流公司拥有多个车场,而每个车场都有若干车辆用于配送，决策者需要根据客户的所在位置，将客户分配到合适的车场和车辆中。 1 数学模…

阅读更多...

c++静态成员变量和静态成员函数

c++静态成员变量和静态成员函数

1）C入门级小知识，分享给将要学习或者正在学习C开发的同学。 2）内容属于原创，若转载，请说明出处。 3）提供相关问题有偿答疑和支持。我们可以使用 static 关键字来把类成员定义为静态的。当我们声明类的成…

阅读更多...

华为云鲲鹏架构docker部署2048小游戏

华为云鲲鹏架构docker部署2048小游戏

华为云鲲鹏架构docker部署2048小游戏 1. 鲲鹏架构ESC2. 配置docker3. 上传2048镜像4. 删除容器,镜像 1. 鲲鹏架构ESC 2. 配置docker 安装dockeryum -y install docker开机启动 systemctl enable docker启动docker服务 systemctl start docker查询docker的运行版本 docker -v3…

阅读更多...

注意力机制之ECA-Net：Efficient Channel Attention for Deep Convolutional Neural Network

注意力机制之ECA-Net：Efficient Channel Attention for Deep Convolutional Neural Network

论文link：link code：code 1.摘要近年来，通道注意机制被证明在改善深层卷积神经网络（CNN）的性能方面提供了巨大的潜力。然而现有的大多数方法都致力于开发更复杂的注意模块以获得更好的性能，这不可避免地增…

阅读更多...

1.linux操作系统CPU负载

1.linux操作系统CPU负载

目录概述CPU平均负载查看平均负载结束概述 CPU 使用率和CPU 平均使用率。 CPU平均负载单位时间内系统处于 [可运行状态] 和 [不可中断状态] 的平均进程数，就是平均活跃进程数，和CPU使用率并没有直接关系可运行状态正在使用CPU或者正等待CPU的进…

阅读更多...

从头开始构建一个小规模的文生视频模型

从头开始构建一个小规模的文生视频模型

OpenAI 的 Sora、Stability AI 的 Stable Video Diffusion 以及许多其他已经发布或未来将出现的文本生成视频模型，是继大语言模型 (LLM) 之后 2024 年最流行的 AI 趋势之一。在这篇博客中，作者将展示如何将从头开始构建一个小规模的文本生成视频模型&a…

阅读更多...

C# 实现websocket双向通信

C# 实现websocket双向通信

🎈个人主页：靓仔很忙i 💻B 站主页：👉B站👈 🎉欢迎 👍点赞✍评论⭐收藏 🤗收录专栏：C# 🤝希望本文对您有所裨益，如有不足之处&#xff…

阅读更多...

AWT的菜单组件

AWT的菜单组件

AWT的菜单组件前言一、菜单组件的介绍常见的菜单相关组件常见菜单相关组件集成体系图菜单相关组件使用小要点二、AWT菜单组件的代码示例示例一示例二实现思路前言推荐一个网站给想要了解或者学习人工智能知识的读者，这个网站里内容讲解通俗易懂且风趣幽默&…

阅读更多...

如何使用sr2t将你的安全扫描报告转换为表格格式

如何使用sr2t将你的安全扫描报告转换为表格格式

关于sr2t sr2t是一款针对安全扫描报告的格式转换工具，全称为“Scanning reports to tabular”，该工具可以获取扫描工具的输出文件，并将文件数据转换为表格格式，例如CSV、XLSX或文本表格等，能够为广大研究人员提供一个…

阅读更多...

MySQL详细介绍：开源关系数据库管理系统的魅力

MySQL详细介绍：开源关系数据库管理系统的魅力

学习总结 1、掌握 JAVA入门到进阶知识(持续写作中……） 2、学会Oracle数据库入门到入土用法(创作中……） 3、手把手教你开发炫酷的vbs脚本制作(完善中……） 4、牛逼哄哄的 IDEA编程利器技巧(编写中……） 5、面经吐血整理的面试技…

阅读更多...

理解GPT2：无监督学习的多任务语言模型

理解GPT2：无监督学习的多任务语言模型

目录一、背景与动机二、卖点与创新三、几个问题四、具体是如何做的 1、更多、优质的数据，更大的模型 2、大数据量，大模型使得zero-shot成为可能 3、使用prompt做下游任务五、一些资料一、背景与动机基于 Transformer 解码器的 GPT-1 证明…

阅读更多...

最新文章

推荐文章