[ComfyUI]腾讯开源黑科技Sonic，插件更新，更加可控啦

[ComfyUI]腾讯开源黑科技Sonic，插件更新，更加可控啦

news/2025/2/18 23:01:27/文章来源:https://blog.csdn.net/c3618392/article/details/145643951

一、Sonic更新介绍

大家还记得我前分享过腾讯开源的Sonic这个项目吧，通过照片+声音就可以生成非常不错的数字人开口说话的视频。

当时我就挺满意的，不过那时候输出还只能输出正方形的视频，这点就让我留有遗憾。

今天我再去翻作者的项目官网，我发现作者给力，把这块给更新了，现在支持非正方形的输出了，爱了爱了。

今天给大家说一下修改的地方，参数有了一些小调整。

二、详细说明

工作流稍微改了一点，主要是里面的参数，大家直接看我这个最新工作流截图：

我把变动点说一下：

SONICTLoader 节点变简单了，不需要自己配置路径
参数默认按我截图设置即可。

SONIC_PreData：这个节点核心参数多了一个duration，这个就是截取视频时长的意思，单位为秒。我这里直接把视频里面的时长传递过来了。

然后最重要的是现在min_resolution这个参数就对应最短边了，不会全部裁剪成正方形输出了。

最后，主模型要选择svd_xt_1_1.safetensors了，这个模型之前也需要，把它拷过来放到 ComfyUI/models/checkpoints

另外sonic这个模型还要

三、云端镜像

大家如果没有本地 ComfyUI 环境，或者本地显卡配置低于 16G 的，可以使用嘟嘟部署的仙宫云镜像，可直接加载使用。后续分享的工作流都会更像到镜像中，一周更新一次，方便大学学习。

目前整合了2个镜像，一个是Flux绘图用的，另外一个是针对视频模型的，之所以分开是一些模型兼容问题，分开比较好处理。

今天这个数字人案例已经弄到镜像上了，欢迎体验。

镜像名称：嘟嘟AI绘画趣味学

云平台镜像地址：

https://www.xiangongyun.com/image/detail/d961a7dc-ade3-4bd5-a7c6-92ac49ff5e4b?r=37BCLY

https://www.xiangongyun.com/image/detail/81716d29-4461-4b0b-ba4b-7b9b7dd569d3?r=37BCLY

新用户通过邀请码注册，总共可获得 8 元奖励，体验 4 个小时的 4090 作图时长。

四、总结

这就是Sonic的更新介绍了，效果我还是很满意的，感觉可以用来搞东西玩了。
后面给大家介绍一些声音克隆的软件，结合起来效果就很好。
上个用CosyVoice V2克隆声音的画面。

技术的迭代是飞快的，要关注最新的消息才不会掉队。

嘟嘟每天分享最新的ComfyUI技术前沿。

本篇中的工作流和模型网盘链接：https://pan.quark.cn/s/dd5da20b5287

我是嘟嘟，专注于 AI 绘画以及 AI 工具分享，欢迎来一起交流。

如果觉得文章有帮助，请帮忙点赞收藏关注一下呦~

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/18039.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

设计模式Python版命令模式（上）

设计模式Python版命令模式（上）

文章目录前言一、命令模式二、命令模式示例前言 GOF设计模式分三大类： 创建型模式：关注对象的创建过程，包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式：关注类和对象之间的组合&…

阅读更多...

微服技术栈之Spring could gateway

微服技术栈之Spring could gateway

0 前言之前使用到的gateway技术栈 ，光靠记忆可能没有记住那么多的，gateway当今比较主流的网关技术栈了。说到gateway，不得不提及Zuul，而Zuul已经被淘汰了。 1 概述 Could全家桶有个很重要的组件就是网关，在1.X版本…

阅读更多...

上课啦 | 2月17日软考高项【5月备考班】

上课啦 | 2月17日软考高项【5月备考班】

相关文章推荐福利：【软考-电子书】赠送 | 信息系统项目管理师教程软考证书以考代评评定的职称是什么？聘任步骤？ 添加图片注释，不超过 140 字（可选） 软考高项课程：2月17日开课 | 软考-高…

阅读更多...

小米 R3G 路由器刷机教程（Pandavan）

小米 R3G 路由器刷机教程（Pandavan）

小米 R3G 路由器刷机教程（Pandavan） 一、前言小米 R3G 路由器以其高性价比和稳定的性能备受用户青睐。然而，原厂固件的功能相对有限，难以满足高级用户的个性化需求。刷机不仅可以解锁路由器的潜能，还能通过第三方固…

阅读更多...

【电脑】u盘重装win7

【电脑】u盘重装win7

u盘必须8GB以上 1. CPU型号首先查看CPU的型号看看到底能不能装win7 2. 下载光盘映像文件网址看电脑是多少位的机器(32位下载x86 64位下载x64) 一共是这么多个版本按需下载对应的版本电脑小白推荐无脑下载旗舰版将链接复制到迅雷进行下载 3. 下载软碟通网址下…

阅读更多...

wps或office的word接入豆包API(VBA版本)

wps或office的word接入豆包API(VBA版本)

直接上代码，由于时间匆忙，以后写个详细的教程 #If VBA7 ThenPrivate Declare PtrSafe Function URLDownloadToFile Lib "urlmon" Alias "URLDownloadToFileA" (ByVal pCaller As Long, ByVal szURL As String, ByVal szFileName As…

阅读更多...

Redis——优惠券秒杀问题（分布式id、一人多单超卖、乐悲锁、CAS、分布式锁、Redisson）

Redis——优惠券秒杀问题（分布式id、一人多单超卖、乐悲锁、CAS、分布式锁、Redisson）

#想cry 好想cry 目录 1 全局唯一id 1.1 自增ID存在的问题 1.2 分布式ID的需求 1.3 分布式ID的实现方式 1.4 自定义分布式ID生成器（示例） 1.5 总结 2 优惠券秒杀接口实现 3 单体系统下一人多单超卖问题及解决方案 3.1 问题背景 3.2 超卖问题的…

阅读更多...

USB Flash闪存驱动器安全分析（第一部分）

USB Flash闪存驱动器安全分析（第一部分）

翻译原文链接：Hacking Some More Secure USB Flash Drives (Part I) | SySS Tech Blog 文章翻译总结：文章对一些具有AES硬件加密的USB闪存驱动器的网络安全分析研究。研究由SySS的IT安全专家Matthias Deeg进行，他在2022年初发现了几个安全漏…

阅读更多...

[前端] axios网络请求二次封装

[前端] axios网络请求二次封装

一、场景描述为什么要对axios网络请求进行二次封装? 解决代码的复用，提高可维护性。 —这个有两个方案：一个是二次封装一个是实例化。（设置一些公共的参数，然后进行请求） 为什么可以解决代码的复用： 这是…

阅读更多...

DeepSeek助力：打造属于你的GPTs智能AI助手

DeepSeek助力：打造属于你的GPTs智能AI助手

文章目录一、环境准备1.安装必要的工具和库2. 选择合适的开发语言二、核心技术选型1. 选择适合的AI框架三、功能实现1. 文本生成与对话交互2. 代码生成与自动补全3. 数据分析与报告生成四、案例实战1. 搭建一个简单的聊天机器人2. 创建一个代码生成器五、总结与展望1. 当前…

阅读更多...

网络基础【UDP、TCP】

网络基础【UDP、TCP】

1.UDP 首先我们学习UDP和TCP协议要从这三个问题入手 1.报头和有效载荷如何分离、有效载荷如何交付给上一层的协议？2.认识报头3.学习该协议周边的问题 UDP报头 UDP我们先从示意图来讲解，认识报头。 UDP协议首部有16位源端口号，16位目的端…

阅读更多...

推荐的、好用的线性稳压器

推荐的、好用的线性稳压器

前言内容来自B站up主-工科男孙老师的视频视频内容：测评网友推荐的线性稳压器，以及这些线性稳压器的应用场景。视频链接：除了1117，还有哪些更好用的线性稳压器？ 1、1117的缺点体积太大，浪费主板的空间不…

阅读更多...

2025最新出炉--前端面试题九

2025最新出炉--前端面试题九

文章目录 1. Vue 和 React 的使用经验对比2. vue 的 computed 和 watch 有什么区别3. v-model 平时你都怎么使用4. import 和 require 之间什么区别5. 说一下 vue 的缓存组件6. vue3.0 为什么使用 proxy 拦截数据7. 能讲讲 vuex 吗, 刷新页面会怎样8. http1.1 和 http2.0 之间什…

阅读更多...

rancher on k3s

rancher on k3s

本次部署采用3节点的etcd服务2master节点的k3s使用helm部署的ranchervip(keepalived) 一、安装etcd服务 # 准备 3 个节点部署 etcd cd /hskj/tmp wget https://github.com/etcd-io/etcd/releases/download/v3.3.15/etcd-v3.3.15-linux-amd64.tar.gz tar xzvf etcd-v3.3.15-…

阅读更多...

NLLB 与 ChatGPT 双向优化：探索翻译模型与语言模型在小语种应用的融合策略

NLLB 与 ChatGPT 双向优化：探索翻译模型与语言模型在小语种应用的融合策略

作者：来自 vivo 互联网算法团队- Huang Minghui 本文探讨了 NLLB 翻译模型与 ChatGPT 在小语种应用中的双向优化策略。首先介绍了 NLLB-200 的背景、数据、分词器和模型，以及其与 LLM（Large Language Model）的异同和协同关系。接着…

阅读更多...

无人机图像拼接数据的可视化与制图技术：以植被监测为例

无人机图像拼接数据的可视化与制图技术：以植被监测为例

无人机技术在生态环境监测中的应用越来越广泛，尤其是在植被监测领域。通过无人机获取的高分辨率影像数据，结合GIS技术，可以实现对植被覆盖、生长状况等的精确监测与分析。本文将通过一个实际案例，详细讲解无人机图像拼接数据的可视…

阅读更多...

ONES 功能上新｜ONES Copilot、ONES TestCase、ONES Wiki 新功能一览

ONES 功能上新｜ONES Copilot、ONES TestCase、ONES Wiki 新功能一览

ONES Copilot 支持基于当前查看的工作项相关信息，利用 AI 模型，在系统中进行相似工作项的查找，包括基于已关联工作项的相似数据查找。应用场景： 在查看工作项时，可利用 AI 模型，基于语义相似度&#xff0c…

阅读更多...

基于带通滤波的camera脏污检测算法可以完全替代imatest

基于带通滤波的camera脏污检测算法可以完全替代imatest

1.概要脏污检测算法，基于opencv c实现，便于模组厂快速集成到软件工具中，适用于camera模组厂脏污拦截，特别是对浅脏污具备很好的定位效果；便于画质评价工程师了解camera模组制程的问题提出改善方向。 2.技术介绍下图…

阅读更多...

后勤数据源定制主控室

后勤数据源定制主控室

场景：在学习了解后勤数据源过程中，看到觉得有用的note，分享给大家。 1779063 - 常见问题：关于 LO 数据提取 - 定制主控室（事务 LBWE） 1.问题： 是否需要为每个应用程序组件下的每个数据源添加池…

阅读更多...

云原生AI Agent应用安全防护方案最佳实践（上）

云原生AI Agent应用安全防护方案最佳实践（上）

当下，AI Agent代理是一种全新的构建动态和复杂业务场景工作流的方式，利用大语言模型（LLM）作为推理引擎。这些Agent代理应用能够将复杂的自然语言查询任务分解为多个可执行步骤，并结合迭代反馈循环和自省机制&#xff0…

阅读更多...

最新文章

推荐文章