阿里开源正式开园文生视频、图生视频模型-通义万相 WanX2.1

阿里开源正式开园文生视频、图生视频模型-通义万相 WanX2.1

news/2025/2/28 13:38:37/文章来源:https://blog.csdn.net/qq_42691309/article/details/145915872

简介

发布时间与背景

通义万相 Wan2.1 模型于 2025年1月发布，并迅速登顶视频生成领域权威评测 Vbench 的榜首，超越了包括 Sora、HunyuanVideo、Minimax 等国内外知名模型，并于这周开源。它是阿里云在 AI 视频生成领域的最新成果，旨在提供高质量、高效率的视频生成能力。
在这里插入图片描述

核心功能

Wan X2.1 支持多种视频生成任务，包括文生视频（Text-to-Video）和图生视频（Image-to-Video），并具备动态字幕生成、多语言配音等多模态融合能力。支持分辨率从 480P 到 1080P ，满足不同场景需求。

模型架构

参数规模

Wan2.1 提供两种参数规模的模型版本：

1.3B 版本：轻量化设计，适合消费级 GPU，仅需 8.2GB 显存即可生成 480P 分辨率的视频，适用于对生成速度要求较高的场景4。
14B 版本：高性能版本，生成效果更优，适用于专业人士和对画质要求更高的任务。

多模态融合技术

Wan2.1 引入了多模态融合技术，能够同时处理文本、图像、音频等多种输入，生成包含动态字幕、语音配音的高清视频。
这种技术确保了视频输出的高质量和自然感，尤其是在复杂运动和物理规律还原方面表现卓越。

编解码优化

Wan2.1 在视频编解码方面进行了深度优化，支持高效的视频生成和播放，确保输出视频的流畅性和清晰度。
在这里插入图片描述

性能对比

Vbench 评测结果

在 Vbench 测评中，Wan2.1 的性能全面领先其他开源和闭源模：

复杂运动处理：相比 Sora 和 HunyuanVideo，Wan2.1 在人物动作、物体运动的连贯性上表现更佳5。
物理规律还原：如水波、火焰等动态效果的生成更加逼真，接近专业级水准。

与其他模型的对比

Sora ：虽然 Sora 在创意生成上有一定优势，但 Wan2.1 在稳定性和细节表现上更胜一筹。
Luma 和 Gen3 ：这些模型在生成速度上稍快，但在画质和语义理解能力上不及 Wan2.1。
Pika ：Pika 更注重风格化生成，而 Wan2.1 则兼顾写实与艺术风格。
硬件兼容性：
Wan2.1 的 1.3B 版本能够在消费级显卡（如 8GB 显存的 GPU）上运行，大幅降低了使用门槛。相比之下，许多闭源模型需要高性能计算资源。

相关文献

1.3B模型国内下载
14B模型国内下载
github项目地址
并且wanx2.1目前支持comfyui了已经，有兴趣的可以试试～

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/25250.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Python的那些事第三十四篇：基于 Plotly 的交互式图表与仪表板设计与应用

Python的那些事第三十四篇：基于 Plotly 的交互式图表与仪表板设计与应用

基于 Plotly 的交互式图表与仪表板设计与应用摘要：本文深入探讨了 Plotly 这一强大的交互式图表和仪表板库。首先介绍了 Plotly 的背景与发展历程，随后详细阐述了其核心功能特性，包括丰富的图表类型、高度的自定义能力以及便捷的交互操作。通过实际案例分析和示例代码展示…

阅读更多...

英文论文查重，Turnitin和IThenticate两个系统哪个更合适？

英文论文查重，Turnitin和IThenticate两个系统哪个更合适？

Turnitin系统和IThenticate系统都是检测英文论文的查重系统，但是两者之间还是有一些不一样的。下面针对这两个系统给大家具体分析一下。一、Turnitin系统 Turnitin检测系统： https://truth-turnitin.similarity-check.com Turnitin是世界上主流的…

阅读更多...

[Linux]项目自动化构建工具-make/Makefile

[Linux]项目自动化构建工具-make/Makefile

项目自动化构建工具-make/Makefile make与Makefile单文件Makefile多文件Makefile 缓冲区首先理清多文件之间的关系： 这里为什么没有包含test.h头文件？因为在当前工作目录下，因此不需要包含test.h，如果把test.h移到上一级目录&…

阅读更多...

ArcGIS Pro中打造精美高程渲染图的全面指南

ArcGIS Pro中打造精美高程渲染图的全面指南

一、引言高程渲染图是地理信息系统（GIS）中用于展示地形地貌的重要工具。一张精美的高程渲染图，不仅能够清晰地呈现地形的起伏变化，还能增强视觉表现力，使得数据更加生动、直观。ArcGIS Pro作为一款强大的GIS软件&…

阅读更多...

ollama本地部署DeepSeek（Window图文说明）

ollama本地部署DeepSeek（Window图文说明）

目录 1. ollama下载2. 环境变量3. deepseek下载4. 彩蛋 1. ollama下载安装包下载：Window安装包命令行方式安装：（不推荐使用exe方式进行安装，默认会在C盘路径下） 点击install之后： 2. 环境变量先配…

阅读更多...

sqlilab 46 关（布尔、时间盲注）

sqlilab 46 关（布尔、时间盲注）

sqlilabs 46关（布尔、时间盲注） 46关有变化了，需要我们输入sort，那我们就从sort1开始递增测试： 发现测试到sort4就出现报错： 我们查看源码： 从图中可看出：用户输入的sort值被用于查…

阅读更多...

【02】Cocos游戏开发引擎从0开发一款游戏-cocos项目目录结构熟悉-调试运行项目-最重要的assets资源文件认识-场景sense了解-优雅草卓伊凡

【02】Cocos游戏开发引擎从0开发一款游戏-cocos项目目录结构熟悉-调试运行项目-最重要的assets资源文件认识-场景sense了解-优雅草卓伊凡

【02】Cocos游戏开发引擎从0开发一款游戏-cocos项目目录结构熟悉-调试运行项目-最重要的assets资源文件认识-场景sense了解-优雅草卓伊凡开发背景接下来我们直接打开我们的项目开始进一步操作， 实战开发导入项目我把得到的项目解压到本地，我们开…

阅读更多...

spring结合mybatis多租户实现单库分表

spring结合mybatis多租户实现单库分表

实现单库分表思路：student表数据量大，所以将其进行分表处理。一共有三个分表，分别是student0，student1，student2，在新增数据的时候，根据请求头中的meta-tenant参数决定数据存在哪张表表。数…

阅读更多...

数据结构：Top-K问题详解

数据结构：Top-K问题详解

一.Top-K问题 #include<stdio.h> //先自主创建n个数据 void CreateNDate() {// 造数据int n 100000;srand(time(0));//表示随时间初始化随机生成数的种子const char* file "data.txt";///创建一个文件FILE* fin fopen(file, "w");//“只写”写入创…

阅读更多...

基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成

基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成

本教程的演示都将在 Flink CDC CLI 中进行，无需一行 Java/Scala 代码，也无需安装 IDE。这篇教程将展示如何基于 Flink CDC YAML 快速构建 MySQL 到 Kafka 的 Streaming ELT 作业，包含整库同步、表结构变更同步演示和关键参数介绍。准备阶段…

阅读更多...

AI绘画软件Stable Diffusion详解教程（3）：Windows系统本地化部署操作方法（通用版）

AI绘画软件Stable Diffusion详解教程（3）：Windows系统本地化部署操作方法（通用版）

上一篇教程介绍了如何在本地部署Stable Diffusion专业版，虽然便于技术人员研究，但是普通人使用起来不便捷，每次只能通过cmd窗口的指令形式或者python代码方式来画图，要记很多的指令很繁琐。本篇教程教您搭建webui版的&#xff0…

阅读更多...

进程 ─── linux第10课

进程 ─── linux第10课

目录回顾上一节进程基本概念描述进程 - PCB task_struct - PCB的一种 task_ struct内容分类组织进程下面来介绍task_struct内部 PID 和PPID 子进程与父进程 getpid()和getppid() 杀进程 exe 和 cwd 回顾上一节 1. 如果我们写的程序要访问硬件,必定通过sy…

阅读更多...

量子计算的数学基础：复数、矩阵和线性代数

量子计算的数学基础：复数、矩阵和线性代数

量子计算是基于量子力学原理的一种新型计算模式，它与经典计算机在信息处理的方式上有着根本性的区别。在量子计算中，信息的最小单位是量子比特（qubit），而不是传统计算中的比特。量子比特的状态是通过量子力学中的数学工具来描述的，因此，理解量子计算的数学基础对于深入学…

阅读更多...

PostgreSQL_安装部署

PostgreSQL_安装部署

一、Windows系统下安装 1.下载安装包登录PostgreSQL: Downloads官网： 选择14.12版本，点击下载： 2.安装PostgrSQL14.12 双击exe安装包程序，准备安装： 选择安装路径： 选择想安装的工具： 选择数…

阅读更多...

Idea 和 Pycharm 快捷键

Idea 和 Pycharm 快捷键

一、快捷键二、Pycharm 中怎么切换分支参考如下如果在界面右下角没有看到当前所在的分支，如 “Git:master” 3. 有了 4.

阅读更多...

第十四届蓝桥杯：DFS之飞机降落

第十四届蓝桥杯：DFS之飞机降落

这道题，由于它的数据范围是非常小的，我们可以采取暴力搜索的措施，把每种情况都枚举出来，如果有能行的情况就返回true 同时我们也要学会剪枝，如果已经确认飞机不能降落，就不要往下再展开了 #include <i…

阅读更多...

Oracle 查询表空间使用情况及收缩数据文件

Oracle 查询表空间使用情况及收缩数据文件

本文介绍Oracle收缩数据文件的相关操作，运维工作中有时会需要通过收缩数据文件来释放磁盘空间。数据文件初始化方式： 1.我们创建表空间一般有两种方式初始化其数据文件，即指定初始大小为32G（很大的值）或指定初始大小为…

阅读更多...

android 新增native binder service 方式（一）

android 新增native binder service 方式（一）

关于之前说的native service 之前有写过类似的文章，今天主要介绍下如何通过binder 方式跨进程调用和回调,结合网上的各种文章，总结了3种常见的添加方式，供大家参考。一，aidl 文件定义先看下整体的目录结构 libserviceaidl 就是…

阅读更多...

【大模型系列篇】大模型微调工具 LLama-Factory、Unsloth、ms-SWIFT

【大模型系列篇】大模型微调工具 LLama-Factory、Unsloth、ms-SWIFT

今日号外：🔥🔥🔥 DeepSeek团队正式启动为期五天的开源计划 Day3：DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法（GEMM）设计的库，具有细粒度缩放功能，如 Deep…

阅读更多...

安宝特科技 | Vuzix Z100智能眼镜+AugmentOS：重新定义AI可穿戴设备的未来——从操作系统到硬件生态，如何掀起无感智能革命？

安宝特科技 | Vuzix Z100智能眼镜+AugmentOS：重新定义AI可穿戴设备的未来——从操作系统到硬件生态，如何掀起无感智能革命？

一、AugmentOS：AI可穿戴的“操作系统革命” 2025年2月3日，Vuzix与AI人机交互团队Mentra联合推出的AugmentOS，被业内视为智能眼镜领域的“iOS时刻”。这款全球首个专为智能眼镜设计的通用操作系统，通过三大突破重新定义了AI可穿戴…

阅读更多...

最新文章

推荐文章