MultiDiff 论文解读

MultiDiff 论文解读

news/2025/1/2 14:11:02/文章来源:https://blog.csdn.net/m0_60177079/article/details/144807589

一、CameraCtrl

AnimateDiff->MotionCtrl->CameraCtrl

CameraCtrl将多帧图像的Plucker射线输入到Camera Encoder，Plucker射线可以表示每个像素对应的光线方向。

Camera Encoder包括ResNet block和Temporal Attention，来提取每一帧相机位姿的时序关系。

Camera Fusion部分，包括一个预训练的T2V模型，其中每一层的spatial attention 用于提取每张图像的特征，并与camera encoder提取的特征融合送入temporal attention。（b图）

二、MultiDiff

MultiDiff实现从单张RGB图像直接生成一组一致性图像。这个工作类似VideoCrafter，通过生成depth map并warp到特定的视角作为输入条件。

整体框架基于已训练的VideoCrafter，包括网络中的3D U-Net，encoder和decoder。

输入一组图像经过加噪并输入到3D U-Net中。输入一张参考图像和参考轨迹作为条件，将每张图片经过深度估计器得到Depth map并通过轨迹中不同的相机位姿来进行变换，并warp到参考图像中并经过编码后类似controlnet输入到3D U-Net中作为特定轨迹的输入。

Structured noise distribution

由于同一场景，不同视角捕捉的图像存在相关性，但是初始化噪声均为独立的正态分布，可能导致恢复结果不一致。

而论文中将参考视图warp的函数加权到输入图像的其他的相机视图中，并用高斯噪声填补未加权的部分，保证噪声相关性。

cameractrl：https://hehao13.github.io/projects-CameraCtrl/

multidiff：https://gitcode.com/gh_mirrors/mu/multidiff

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/497686.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

C语言性能优化：从基础到高级的全面指南

C语言性能优化：从基础到高级的全面指南

引言 C 语言以其高效、灵活和功能强大而著称，被广泛应用于系统编程、嵌入式开发、游戏开发等领域。然而，要写出高性能的 C 语言代码，需要对 C 语言的特性和底层硬件有深入的了解。本文将详细介绍 C 语言性能优化的背后技术，并通过…

阅读更多...

用点包图洞察医学数据：以血压分析为例

用点包图洞察医学数据：以血压分析为例

在医学数据分析的广袤天地里，可视化手段无疑是我们快速洞察数据、挖掘关键信息的有力 “武器”。今天，就来给各位医学同仁介绍一种别具一格的可视化图表 —— 点包图（Diverging Dotplot），顺便分享一段用 Python 实操绘…

阅读更多...

python爬虫----爬取视频实战

python爬虫----爬取视频实战

python爬虫-爬取视频本次爬取，还是运用的是requests方法首先进入此网站中，选取你想要爬取的视频，进入视频页面，按F12，将网络中的名称栏向上拉找到第一个并点击，可以在标头中，找到后续我们想要…

阅读更多...

C# 中使用 MassTransit

C# 中使用 MassTransit

在生产环境中使用 MassTransit 时，通常需要进行详细的配置，包括设置连接字符串、配置队列、配置消费者、处理重试和错误队列等。以下是一个完整的示例，展示了如何在 ASP.NET Core 应用程序中配置 MassTransit，包括请求/响应模式和…

阅读更多...

【Hackthebox 中英 Write-Up】Manipulating a CRUD API | 操控 CRUD API：一步步提取 Flag

【Hackthebox 中英 Write-Up】Manipulating a CRUD API | 操控 CRUD API：一步步提取 Flag

Objective | 目标 This challenge demonstrates how to interact with a CRUD API to perform Update, Delete, and Search operations to retrieve the flag. 本次挑战旨在演示如何与 CRUD API 交互，通过执行更新、删除和搜索操作来获取 Flag。操控 CRUD AP…

阅读更多...

【OpenGL ES】GLSL基础语法

【OpenGL ES】GLSL基础语法

1 前言本文将介绍 GLSL 中数据类型、数组、结构体、宏、运算符、向量运算、矩阵运算、函数、流程控制、精度限定符、变量限定符（in、out、inout）、函数参数限定符等内容，另外提供了一个 include 工具，方便多文件管理 glsl 代码&a…

阅读更多...

【Compose multiplatform教程18】多平台资源的设置和配置

【Compose multiplatform教程18】多平台资源的设置和配置

要正确配置项目以使用多平台资源，请执行以下操作： 添加库依赖项。为每种资源创建必要的目录。为限定资源创建其他目录（例如，深色 UI 主题或本地化字符串的不同图像）。依赖项和目录设置要访问多平台项目中的资源…

阅读更多...

线索二叉树的实现（c语言）

线索二叉树的实现（c语言）

一、前言：什么是二叉树的线索化？（为什么要有二叉树的线索化？） 通过前面内容的学习，我们知道了二叉树的存储结构其实是通过二叉链表的方式实现的。但二叉链表由于每个结点均有左右孩子域，这使得…

阅读更多...

通过python对excel进行数据分析和可视化

通过python对excel进行数据分析和可视化

import pandas as pd import matplotlib.pyplot as plt import seaborn as snsfile_path "C:\\Users\\86138\\Desktop\\book_list-计算机-机器学习-linux-android-数据库-互联网.xlsx" data pd.read_excel(file_path)need_data data[[书名, 评分, 评价人数]].copy…

阅读更多...

考研互学互助系统｜Java｜SSM｜VUE｜前后端分离

考研互学互助系统｜Java｜SSM｜VUE｜前后端分离

【技术栈】 1⃣️：架构: B/S、MVC 2⃣️：系统环境：Windowsh/Mac 3⃣️：开发环境：IDEA、JDK1.8、Maven、Mysql5.7 4⃣️：技术栈：Java、Mysql、SSM、Mybatis-Plus、VUE、jquery,html 5⃣️数据库可…

阅读更多...

SpringCloud整合skywalking实现链路追踪和日志采集

SpringCloud整合skywalking实现链路追踪和日志采集

1.部署skywalking https://blog.csdn.net/qq_40942490/article/details/144701194 2.添加依赖 <dependency><groupId>org.apache.skywalking</groupId><artifactId>apm-toolkit-logback-1.x</artifactId><version&g…

阅读更多...

【Spring】 Bean 注入 HttpServletRequest 能保证线程安全的原理

【Spring】 Bean 注入 HttpServletRequest 能保证线程安全的原理

文章目录前言1. 图示2. 源码坐标后记前言今天看了一段老业务代码，HttpServletRequest 被注入后直接用于业务逻辑。好奇Spring是如何解决线程安全问题。 Controller public class TestController {ResourceHttpServletRequest request;ResponseBodyGetMapping(…

阅读更多...

0基础学前端-----CSS DAY11

0基础学前端-----CSS DAY11

0基础学前端-----CSS DAY11 视频参考：B站Pink老师今天是CSS学习的第十一天，今天开始的笔记对应Pink老师课程中的CSS第六天的内容。本节重点：CSS定位本章目录 0基础学前端-----CSS DAY11本节目标1. 定位1.1 为什么需要定位1.2 定位组成1.…

阅读更多...

frameworks 之 WMS添加窗口流程

frameworks 之 WMS添加窗口流程

frameworks 之触摸事件窗口查找 1.获取WindowManager对象2.客户端添加view3. 服务端添加view (NO_SURFACE)4.重新布局 (DRAW_PENDING)4.1 创建 SurfaceControl 5.通知绘制 (COMMIT_DRAW_PENDING， READY_TO_SHOW， HAS_DRAWN)5. 1 布局测量和刷新 6.总结 …

阅读更多...

ARM单片机定时器

ARM单片机定时器

定时器分类定时器资源。基于GD32F103

阅读更多...

【Java】IO流练习

【Java】IO流练习

IO流练习题干： 根据指定要求，完成电话记录、注册、登录注册题干： 完成【注册】功能： 要求： 用户输入用户名、密码存入users.txt文件中若users.txt文件不存在，创建该文件若users.txt文件存在输入…

阅读更多...

Windows API Set：那些“只存在但不被使用“的DLL

Windows API Set：那些“只存在但不被使用“的DLL

API Set 是什么？ 想象一下，Windows就像一个大型图书馆，而API Set就是这个图书馆的索引系统。但这个索引系统非常特别：它是直接内置在Windows加载器中的"虚拟目录"。 // 一个典型的API Set映射示例 api-ms-win-core-mem…

阅读更多...

小程序配置文件 —— 12 全局配置 - pages配置

小程序配置文件 —— 12 全局配置 - pages配置

全局配置 - pages配置在根目录下的 app.json 文件中有一个 pages 字段，这里我们介绍一下 pages 字段的具体用法； pages 字段：用来指定小程序由哪些页面组成，用来让小程序知道由哪些页面组成以及页面定义在哪个目录，…

阅读更多...

正则表达式 - 使用总结

正则表达式 - 使用总结

以下列出了一些常用正则表达式的使用总结： 匹配基本字符使用普通字符匹配：普通字符（如字母、数字、符号）在正则表达式中表示自身，例如匹配 "runoob"：/runoob/。使用元字符 . 匹配任意字符&…

阅读更多...

OpenCV计算机视觉 03 椒盐噪声的添加与常见的平滑处理方式（均值、方框、高斯、中值）

OpenCV计算机视觉 03 椒盐噪声的添加与常见的平滑处理方式（均值、方框、高斯、中值）

上一篇文章：OpenCV计算机视觉 02 图片修改图像运算边缘填充阈值处理目录添加椒盐噪声图像平滑常见处理方式均值滤波 (blur) 方框滤波 (boxFilter) 高斯滤波 (GaussianBlur) 中值滤波 (medianBlur) 添加椒盐噪声 def add_peppersalt_noise(image, n…

阅读更多...

最新文章

推荐文章