Sora 原理与技术实战笔记一

Sora 原理与技术实战笔记一

news/2024/12/23 19:05:39/文章来源:https://blog.csdn.net/weixin_41783424/article/details/136383043

b 站视频合集
【AI+X组队学习】Sora原理与技术实战：Sora技术路径详解
Sora 技术报告（OpenAI）
huggingsd 文生图视频系列的一个开源项目
最强视频生成模型Sora相关技术解析
https://github.com/lichao-sun/SoraReview

惊艳效果：

长视频
高清
视频融合能力
同一场景的多角度/镜头的生成能力

TeText-to-video: 文生视频
Image-to-video: 图生视频
Video-to-video: 改变源视频风格or场景
Extending video in time: 视频拓展(前后双向)
Create seamless loops: Tiled videos that seem like they never endImage generation: 图片生成 (size最高达到 2048 x 2048)
Generate video in any foformat: From 1920 x 1080 to 1080 x 1920 视频输出比例自定义
Simulate virtual worlds: 链接虚拟世界，游戏视频场景生成Create a video: 长达60s的视频并保持人物、场景一致性

要做世界模拟器。
在这里插入图片描述

DDPM 扩散模型
ViT 把完整的图片 Patch 化，把单个图片的patch 序列化。

为了处理视频，提出了 ViViT,用 Transformers 来处理视频的一个模型.
在这里插入图片描述
包含时空信息的patch。
如何进行样本取样？

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Sora，通过 patch，预测下一个patch，构建一个自回归的方式来进行的。而不是之前那种预测关键帧，插帧的方式。
DALLE 2 也是通过文本的方式。

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/266373.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Cocos游戏开发中的金币落袋效果

Cocos游戏开发中的金币落袋效果

引言 Cocos游戏开发中的金币落袋效果大家好，不知道大家有没有被游戏中的一些小细节打动或吸引。往往游戏就是通过一些与众不同的细节，去留住玩家。金币落袋效果正是如此，它比普通的数值变化来得更加形象，给予玩家成就感和满足感。本文重点给大家介绍一下如何在Coc…

阅读更多...

xss高级靶场

xss高级靶场

一、环境 XSS Game - Ma Spaghet! | PwnFunction 二、开始闯关第一关看看代码试一下直接写明显进来了为什么不执行看看官方文档吧你不执行那我就更改单标签去使用呗 ?somebody<img%20src1%20onerror"alert(1)"> 防御： innerText 第二关…

阅读更多...

Unity（第二十三部）导航

Unity（第二十三部）导航

你可以使用 unity官方提供的 unity导航组件或第三方 unity导航组件，以实现游戏中角色或其他物体的导航。 unity导航组件通常具有多种导航模式，如飞行模式、步行模式、车辆模式等，可以根据不同的需求选择合适的模式。同时，unity导…

阅读更多...

Qt项目：网络1

Qt项目：网络1

文章目录项目：网路项目1：主机信息查询1.1 QHostInfo类和QNetworkInterface类1.2 主机信息查询项目实现项目2：基于HTTP的网络应用程序2.1 项目中用到的函数详解2.2 主要源码项目：网路项目1：主机信息查询使用QHostI…

阅读更多...

如何在Windows部署TortoiseSVN客户端并实现公网连接内网VisualSVN服务端

如何在Windows部署TortoiseSVN客户端并实现公网连接内网VisualSVN服务端

文章目录前言1. TortoiseSVN 客户端下载安装2. 创建检出文件夹3. 创建与提交文件4. 公网访问测试前言 TortoiseSVN是一个开源的版本控制系统，它与Apache Subversion（SVN）集成在一起，提供了一个用户友好的界面，方便用…

阅读更多...

CDH6.3.1离线安装

CDH6.3.1离线安装

一、从官方文档整体认识CDH 官方文档地址如下： CDH Overview | 6.3.x | Cloudera Documentation CDH是Apache Hadoop和相关项目中最完整、测试最全面、最受欢迎的发行版。CDH提供Hadoop的核心元素、可扩展存储和分布式计算，以及基于Web的用户界面和重…

阅读更多...

打造去中心化透明储蓄罐：Solidity智能合约的又一实践

打造去中心化透明储蓄罐：Solidity智能合约的又一实践

一、案例背景传统的储蓄罐通常是由个人或家庭使用，用于存放硬币或小额纸币。然而，这样的储蓄罐缺乏透明性，用户无法实时了解储蓄情况，也无法确保资金的安全性。通过Solidity智能合约，我们可以构建一个去中心化…

阅读更多...

C语言-简单实现单片机中的malloc示例

C语言-简单实现单片机中的malloc示例

概述在实际项目中，有些单片机资源紧缺，需要mallloc内存，库又没有自带malloc函数时，此时，就需要手动编写，在此做个笔录。（已在项目上使用），还可进入对齐管理机制。直接…

阅读更多...

常用SQL查询方法与实例

常用SQL查询方法与实例

目录 SELECT查询 INSERT查询 UPDATE查询 DELETE查询 JOIN查询 GROUP BY查询 HAVING查询窗口函数公共表表达式（CTEs） 递归查询透视表分析函数解透视条件聚合日期函数合并语句情况语句常用SQL查询方法有以下几种： S…

阅读更多...

C 嵌入式系统设计模式 14：轮询模式

C 嵌入式系统设计模式 14：轮询模式

本书的原著为：《Design Patterns for Embedded Systems in C ——An Embedded Software Engineering Toolkit 》，讲解的是嵌入式系统设计模式，是一本不可多得的好书。本系列描述我对书中内容的理解。本文章描述访问硬件的设计模式之七&…

阅读更多...

图像生成地表最强！Playground v2.5技术报告解读重磅来袭！超越SD、DALL·E 3和 Midjourney

图像生成地表最强！Playground v2.5技术报告解读重磅来袭！超越SD、DALL·E 3和 Midjourney

文章链接：https://arxiv.org/pdf/2402.17245 模型地址： https://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic 本文分享了在文本到图像生成模型中实现SOTA美学质量的三个见解。专注于模型改进的三个关键方面：增强色彩和对…

阅读更多...

代码异常处理

代码异常处理

一、异常格式错误堆栈信息的格式大致如下： 第一行包含了错误类型（Exception或Error）和错误描述。从第二行开始，每一行都表示一个调用栈帧（Stack Frame），包含了类名、方法名和代码行号。二、…

阅读更多...

单片机独立按键控制LED状态

单片机独立按键控制LED状态

一、前言这幅图是按键的抖动与时间的联系按键抖动：对于机械开关，当机械鮑点断开、闭合时，由于机械触点的弹性作用，一个开关在闭合时不会马上稳定地接通，在断开时也不会一下子断开，所以在开关闭合及断开的…

阅读更多...

$动态规划|【路径问题】礼物的最大价值（LCR 166.珠宝的最高价值）$

动态规划|【路径问题】礼物的最大价值（LCR 166.珠宝的最高价值）

目录题目题目解析思路 1.状态表示 2.状态转移方程 3.初始化 4.填表顺序 5.返回值代码题目 LCR 166. 珠宝的最高价值 （现在leetcode上面是这个题）这个题跟下面这个题叙述方式一样，就拿下面这个题来讲解） 题目描述&…

阅读更多...

Java配置48-nginx 按照日期生成日志

Java配置48-nginx 按照日期生成日志

1. 背景默认情况下，nginx 的日志会一直输入到 access.log，长时间运行后会导致这个日志文件过大。 2. 方法修改 nginx.conf map $time_iso8601 $logdate {~^(?<ymd>\d{4}-\d{2}-\d{2}) $ymd;default date-not-found;}access_log logs/acce…

阅读更多...

深度神经网络联结主义的本质

深度神经网络联结主义的本质

一、介绍在新兴的人工智能 (AI) 领域，深度神经网络 (DNN) 是一项里程碑式的成就，突破了机器学习、模式识别和认知模拟的界限。这一技术奇迹的核心是一个与认知科学本身一样古老的思想：联结主义。本文深入探讨了联结主义的基本原理&#xff0…

阅读更多...

四、《任务列表案例》后端程序实现和测试

四、《任务列表案例》后端程序实现和测试

本章概要准备工作功能实现前后联调 4.1 准备工作数据库脚本 CREATE TABLE schedule (id INT NOT NULL AUTO_INCREMENT,title VARCHAR(255) NOT NULL,completed BOOLEAN NOT NULL,PRIMARY KEY (id) );INSERT INTO schedule (title, completed) VALUES(学习java, true),(学…

阅读更多...

打造透明银行存储：Solidity智能合约的实践与探索

打造透明银行存储：Solidity智能合约的实践与探索

引言： 随着区块链技术的快速发展，智能合约作为其中的核心组件，正被越来越多地应用于各种场景。作为智能合约的编程语言，Solidity因其对以太坊平台的深度支持而备受关注。在这篇文章中，我们将通过构建一个透明的银行存储…

阅读更多...

【踩坑专栏】追根溯源，从Linux磁盘爆满排查故障：mycat2与navicat不兼容导致日志暴增

【踩坑专栏】追根溯源，从Linux磁盘爆满排查故障：mycat2与navicat不兼容导致日志暴增

昨天遇到了一个比较奇怪的问题，就是在挂起虚拟机的时候，虚拟机提示我XX脚本正在运行，很奇怪，我没有运行脚本，为什么会提示我这个呢。今天恢复虚拟机，也提示了一下脚本的问题，而且发现Linux明显异…

阅读更多...

HCIA-HarmonyOS设备开发认证V2.0-习题

HCIA-HarmonyOS设备开发认证V2.0-习题

目录习题一习题二（待续...）坚持就有收获习题一 # HarmonyOS简介 1. 以下哪几项属于OpenHarmony的技术特性？（）A. 统一OS，弹性部署B. 一次开发，多端部署C. 硬件互助，资源共享2. Ope…

阅读更多...

最新文章

推荐文章