Stable Diffusion能生成视频了!动画版上线!支持文本图像视频多种输入方式

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【GAN和扩散模型】微信技术交流群

西风 发自 凹非寺
转载自:量子位(QbitAI)

Stable Diffusion也能生成视频了!

你没听错,Stability AI推出了一款新的文本生成动画工具包Stable Animation SDK,可支持文本、文本+初始图像、文本+视频多种输入方式。

1feec57278b223805f9b674e7cedf5dd.gif

使用者可以调用包括Stable Diffusion 2.0、Stable Diffusion XL在内的所有Stable Diffusion模型,来生成动画。

Stable Animation SDK的强大功能一经展现,网友惊呼:

哇哦,等不及想试试了!

e6d76dc1d73fdabbd61f9c185812abd2.png

目前,Stability AI疑似还在对这个新工具进行技术优化,不久后将公开驱动动画API的组件源代码。

3D漫画摄影风,不限时长自动生成

Stable Animation SDK可支持三种创建动画的方式:

1、文本转动画:用户输入文prompt并调整各种参数以生成动画(与Stable Diffusion相似)。

2、文本输入+初始图像输入:用户提供一个初始图像,该图像作为动画的起点。图像与文本prompt结合,生成最终的输出动画。

3、视频输入+文本输入:用户提供一个初始视频作为动画的基础。通过调整各种参数,根据文本prompt生成最终的输出动画。

70172406522e96c76ca6d90d9285fd77.gif

除此之外,Stable Animation SDK对生成视频的时长没有限制,但是长视频将需要更长的时间来生成。

1e660c71604a18098e103886e9e3e8f8.gif

Stability AI发布了Stable Animation SDK后,有很多网友分享了自己测试效果,让我们一起看下吧:

c272f360e543cc3b7e5a6f356cdb2dec.gif9bc2ffd95376f30e7158cba34a185581.gif46c3238a1b0cef1e1d354b4b00227a99.gif

Stable Animation SDK可以设置许多参数,例如steps、sampler、scale、seed。

还有下面这么多的预设风格可选择:

3D模型、仿真胶片、动漫、电影、漫画书、数码艺术、增强幻想艺术、等距投影、线稿、低多边形、造型胶土、霓虹朋克、折纸、摄影、像素艺术。

bfa8164009631b2c7d2ec4cd9a6bdb92.gif

目前,动画功能API的使用是以积分计费的,10美元可抵1000积分。

使用Stable Diffusion v1.5模型,在默认设置值(512x512分辨率,30steps)下,生成100帧(大约8秒)视频将消耗37.5积分

默认情况下,每生成1帧,Cadence值设置为1个静止图像,可根据不同的动画模式选择较低或较高的Cadence值。Cadence值的上限是动画中的总帧数,即至少生成一张静止图像。视频转视频的Cadence必须为 1:1。

官方也给出了一个示例,可以看出生成100帧标准动画的标准静止图像(512x512/768x768/1024x1024,30 steps), 随着Cadence值变化,积分的使用情况:

189e537c134a887d41d0bc1dfab70072.png

简单来说,受参数、时长等各种因素的影响,生成视频的费用并不固定。

效果和价格我们都了解了,那如何安装并调用API呢?

1d7922fba0fd76c166ce07b896123bdc.gif

要创建动画并测试SDK的功能,只需要两个步骤即可运行用户界面:

c891ba0d73978bfebac9ecd48fac84db.png

在开发应用程序时,需要先设置一个Python虚拟环境,并在其中安装Animation SDK:

475193daf9c70ec78128ce1f9adee17e.png

具体使用说明书放在文末啦!

4e29867a95748c54a620e9c5df5bb100.png

越发火热的视频生成

最近,视频生成领域变得越来越热闹了。

比如,AI视频生成新秀Gen-2内测作品流出,网友看完作品直呼:太不可思议了!

c0646b15f0c38a08b980c03b71e237a8.gif

Gen-2的更新更是一口气带来了八大功能:

文生视频、文本+参考图像生视频、静态图片转视频、视频风格迁移、故事板(Storyboard)、Mask(比如把一只正在走路的小白狗变成斑点狗)、渲染和个性化(比如把甩头小哥秒变海龟人)。

还有一位名叫Ammaar Reshi的湾区设计师用ChatGPT和MidJourney两个生成AI模型,成功做出一部蝙蝠侠的动画小电影,效果也是非常不错。

180890ec70fb3b2809b8cedbd788340d.gif

自Stable Diffusion开源后,一些开发者通过Google Colab等形式分享了各种魔改后的功能,自动生成动画功能一步步被开发出来。

像国外视频特效团队Corridor,他们基于Stable Diffusion,对AI进行训练,最终能让AI把真人视频转换为动画版本……

大家在对新工具的出现兴奋不已的同时,也有网友对Stable Animation SDK生成的视频所展现出的效果发出质疑:

这与 deforum有什么区别?没有时间线都不连贯,只有非常松散的一帧接一帧的图像。

8d065a69184fc3cdf35eec07eb4c69e4.png

那么你玩过这些工具了吗?感觉效果如何?

传送门:
https://platform.stability.ai/docs/features/animation/using(Stable Animation SDK使用说明书)

参考链接:
[1]https://www.youtube.com/watch?v=xsoMk1EJoAY
[2]https://twitter.com/_akhaliq/status/1656693639085539331
[3]https://stability.ai/blog/stable-animation-sdk

点击进入—>【GAN和扩散模型】微信技术交流群

最新CVPR 2023论文和代码下载

 

后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

GAN和扩散模型交流群成立
扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-GAN或者扩散模型 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如GAN或者扩散模型+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲扫码或加微信号: CVer333,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!▲扫码进星球
▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看62612bffa35bd7a429edef374d40a33e.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22077.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于stable diffusion的embedding训练的一篇随笔

前言 嗯,因为最近ai绘画很火啊,而且可以本地部署,很多人开始投喂ai然后画一些喜欢的东西,这是刚接触4天的笔记,那么我整理下目录,来展示一下这篇笔记都有什么吧。 1,绘画的关键词和反向关键词 2&#xf…

图像处理:Tiler制作你的专属卡通头像和LOGO(圣诞特别篇)

目录 0 前言1 安装与贴图2 算法原理2.1 计算像素频率2.2 计算像素相对距离2.3 计算合适贴图 3 配置功能4 使用:以圣诞老人为例推荐内容 0 前言 Tiler是一种使用各种其他较小图像平铺创建新图像的工具,它与其他马赛克工具不同,因为它可以适应多…

ChatGPT 3.5 的回答只能基于 2021年中期

ChatGPT 无法通过 internet 来访问 2021 年中期之后的数据。 比如无法列举 2021年 IT 界发生的新闻。 2021年的新闻则可以列举出来 以下是2021年IT界十大轰动性的新闻: 苹果公司推出 M1 芯片:苹果公司在2020年底发布了第一批基于自研M1芯片的Mac电脑&…

爆发了!ChatGPT的王炸级更新

最近ChatGPT在互联网行业有多火?恐怕不用小灰多说,大家心中自有答案。 不过,尽管ChatGPT很厉害,但是却存在一个局限。你向它了解最近两年的内容,它都会回复不支持。这是因为ChatGPT模型训练用的是2021年9月之前的数据&…

2021-11-12

高三家长如何填写高校录取志愿事宜 高三家长陪考的目就是和孩子一起经历高考和健康成长的过程,高考成绩真的无法估计,可能超常发挥可能发挥失常,我们从考得好”和“报得好”这两个方面来说了,那么作为家长,要为孩子准…

30 我上车则被套的故事【2019-11-03 2242】

今天我们轻松点,聊聊车。 香港人把买房叫做上车。“不管那么多,赶紧先上车。”这是老一代对年轻人的实用主义传承。在财富积累赛道,上车意味着速度更快;而没有上车的话,个人的发展跟不上城市的发展,在城市发…

普通话证书手把手入门考取流程

简介:普通话证是很有用的一个证书。现在考取后是终身的有效期限。建议大家可以考取一个。 作用:可以认定一些职位所需。例如:教师资格证认定,播音员认定。。。那么,普通话考试考取内容是什么?怎么报名&…

广州华龙展贸考场——科目三

前言:不同考试时间可能考试规则和路段考点会变,仅供参考,以练车为准。2021/05/17考试记录。 一、灯光考点 传祺车灯光视频操作:点击这里 二、科三考试注意细节: 1、换挡不要低头看挡位,否则扣100分

宁海中考政策计算机考试合格,宁海中考指南!同学们、家长们你们准备好了吗?...

原标题:宁海中考指南!同学们、家长们你们准备好了吗? 高考结束了 那么接下来的重点就是中考了! 这也是至关重要的一步 同学们要加油了 今年我县参加初中生学业水平考试报名总人数为6190人,比去年增加52人。 宁海中学创新实验班提前…

广东省考计算机类的比例,广东公务员考试22.4万人参加 竞争比例为19:1

▲昨日,广东公务员省考举行,中午12时30分左右,华南师范大学考点一名考生步出考场。 记者邱伟荣 摄 文/ 记者廖靖文 通讯员符信、粤仁宣 昨日,广东省2011年考试录用公务员“四级联考”笔试在省直和20个地级以上市(不包括深圳市)同步…

2021固原一中高考成绩查询榜,【拍客】2021年固原高考落下帷幕,这些感人瞬间将被永远铭记...

十年磨一剑,一朝试锋芒。6月8日下午,2021年高考落下帷幕,全市一万三千余名考生从各考点走出,不少人大声欢呼、高兴拥抱,有的家长则给考生送上鲜花,祝愿孩子前程似锦。 原州区四个考点 与他们并肩同行的还有…

2023年天津理工大学中环信息学院专升本专业课考试考前安排

2023年天津理工大学中环信息学院高职升本科专业课考试考前提醒 1.考试时间为12月29日上午9:00--11:00,9:00开考后,禁止进入考场参加考试,建议考生提前40分钟到达考点。 2.准考证打印时间为12月27日至29日&#xff0c…

中国农业大学2022年法学硕士研究生拟录取名单

中国农业大学2022年法学硕士研究生拟录取名单 资料的录取名单录取为中国农业大学学校官网公布的,准确性可以得到保证,可以放心使用。通过拟录取名单可以更好的了解当年进入复试的分数线,可以从侧面了解该校该专业的报录比,了解对…

110.【十万字带你深入学习23种设计模式】

Java 23种设计模式 (一)、设计模式相关内容介绍1.软件设计模式概述(1).软件设计模式的产生背景(2).软件设计模式的概念(3).学习设计模式的重要性(4).设计模式分类 2.UML图(1).类图概述(2).类图的作用(3).类图表示法 3.软件设计原则(1).开闭原则 (重写不修改)(2).里氏代换原则 (…

要裸辞考公务员吗?

问: 发哥晚上好,打扰了,我是「15级电子工程专业」,不知道你对裸辞有什么看法? 说一下我自身的情况: 1.毕业四年,现在在做C设备端业务开发(安防行业、高速公路部门)&#…

漫谈程序员系列:看看你离优秀有多远

前段时间(大概是8月份吧)我终于拿到了驾照,科目一、科目二、科目三、科目四都是一次性过的,没有给教练塞钱也没有给教练递烟。考科目三(路考)时,有个女生没能通过还被陪考员讽刺,伤心…

要建立亲密的关系,就必须少一些指责,多一些倾听

于万千人中,遇见你| 第102篇 可以毫不掩饰的说,我希望能够和我爱的人共筑一个百年好合的爱巢——我们互相坦诚,互相需要,互相照顾,互相体谅,总之,最好没有伤害、没有争吵、没有烦恼。…

1024 的那天,我这个三线的程序员是这样度过的

10 月 24 号,也就是程序员节,怎么来的呢?我来给不是程序员的读者朋友们普及下,相信你们也很感兴趣,为什么这一天这么多程序员职业的朋友会在朋友圈给自己庆祝? 当然不会无缘无故的来: 1024 是 2…

郑州家长租房车“花式“陪考上热搜,宇通房车备受关注

经历了种种波折,对多地高三考生而言,2020年高考终于落下了帷幕。高考是千万考生们的“战场”,同样也是家长们的“战场”,每年高考,为了给孩子最大的帮助和支持,家长们都会守在场外,想出各种奇招…

为什么ChatGPT等AI应用使用强化学习而不是监督学习

我也是无意中入了强化学习的领域,因为我原本研究云计算的任务调度,我发现近几年的工作都是基于强化学习的。所以感觉强化学习一定是大趋势,恰好现在ChatGPT这些人工智能产品出现,更是助推了强化学习的风。那么为什么ChatGPT使用强…