AI翻唱+视频剪辑全流程实战

 目录

一、AI翻唱之模型训练

(1)模型部署    

(2)数据集制作——搜集素材

(3)数据集制作——提升音频质量

方法一:使用RVC提供的音频处理功能。

方法二:可以使用音频剪辑工具Adobe Audition

(4)训练

二、AI翻唱之模型推理

三、视频剪辑


前言:从0到1,忙碌了三天,剪了三个视频,其中两个放在了B站(星铁新角色知更鸟翻唱Love Story和Mr. Wonderful),第三个是四个原神角色合唱孤勇者:【知更鸟】Love Story_哔哩哔哩_bilibili

【知更鸟】Mr. Wonderful_哔哩哔哩_bilibili

一、AI翻唱之模型训练

(1)模型部署    

 我使用的是RVC,也可以使用so-vits-svc。

这里分别提供了Nvida显卡和AMD显卡支持的版本

链接:https://pan.baidu.com/s/1vtw_gRCIUdDjPH9cELjVkw?pwd=bi3r 
提取码:bi3r

以Nvida显卡为例,分别下载“RVC1006Nvidia”和“0128补丁”压缩包,分别解压后,复制“0128补丁”内容粘贴到“RVC1006Nvidia”文件夹进行替换

之后,直接点击go-web.bat运行即可。(需要电脑安装好CUDA,安装步骤不再赘述)

(2)数据集制作——搜集素材

方法一:从网上查找现成音频数据集(如github)

方法二:从B站下载音视频制作。

        这里推荐使用DownKyi(哔哩下载姬),在此提供了三个版本。

链接:https://pan.baidu.com/s/1Kyc_cbYL7cIbwFTpXrDVdA?pwd=saq7 
提取码:saq7

                 1.5.9可能存在B站用户无法登陆问题;1.6.1可以登录然后下载高清视频,但是使用过程中出现无法解析的问题。一种解决方案是登录在1.6.1中账号登录后,将1.5.9文件夹内容复制到1.6.1。

另一种方案是直接使用DownKyi-1.0.10-1.win-x64

(3)数据集制作——提升音频质量

由于视频中可能出现背景音或其他不属于角色的杂音,这时就需要进行背景音处理。 

方法一:使用RVC提供的音频处理功能。

直接将原始音频文件拖到上图中左下角红框内,然后点击模型选择HP3,点击转换;

转换后的结果再次放入上图中左下角红框内,点击模型选择onnx_dereverb,点击转换;

也可继续进行别的处理,每个模型的说明见上图。

方法二:可以使用音频剪辑工具Adobe Audition

安装步骤见我的另一篇博客:

Adobe Audition 2024 下载与安装-CSDN博客

处理背景音:

1. 选中一段不含人声的背景音

2. 在“效果”栏中选择“降噪/恢复”中的“降噪(处理)” 

3. 点击“捕捉噪声样本”,然后点击“选择完整文件”,最后点击“应用”就可以啦

(4)训练

1. 输入实验名(自拟),然后选择音频目标采样率(一般为40k),其他保持默认 ,点击“处理数据”即可。(此步骤是将音频剪切成数个短节,“输出信息”栏会提示进程结束)

2. 根据自身情况选择音高提取算法(输入歌声可用pm提速,高质量语音但CPU差可用dio提速,harvest质量更好但慢,rmvpe效果最好且微吃CPU/GPU),之后点击“特征提取”(“输出信息”栏会提示进程结束)

3. 根据自身显卡性能选择“保存频率”、“总训练轮数”和“每张显卡的batch_size”(显卡不太行的建议设置低一点),其他保持默认,点击“一键提取”(“输出信息”栏会提示进程结束)

二、AI翻唱之模型推理

1. 切换到“模型推理”界面,在“推理音色”上选择上面步骤一训练好的模型权重文件;

也可以在网上直接下载别人已经训练好的模型,将.pth文件放在  RVC\assets\weights  目录下,将索引.index文件放在 logs 目录或logs下面的文件夹皆可。

 

2. 输入待处理音频文件路径,即需要模拟的声音或歌曲文件所在的路径。

3. 输入索引index路径。

4. 根据 下图中蓝色部分的说明适当进行调整,即可点击“转换”开始模型推理。

三、视频剪辑

一个好的视听盛宴当然离不开视频剪辑啦。推荐使用PR进行剪辑,当然也可以使用“剪映”这个软件也比较方便。

PR安装与下载方法,可见:Adobe Premiere Pro安装-CSDN博客

该版本的字幕如果无法自动由音频转文字(建议支持正版!),可以使用网易见外工作台 (youdao.com)这个网站进行操作,导出字幕文件后添加到PR即可。在PR内可以拖动字幕来调整出现时间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/326758.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI时代的网络安全战:以智取胜,守护数字安宁

在数字化浪潮的推动下,我们的生活和工作日益离不开互联网。然而,随着人工智能(AI)技术的飞速发展,网络安全问题也日益凸显。美国联邦调查局(FBI)的一则警报如同一记重锤,敲响了我们对…

大米自动化生产线揭秘:包装设备选择与维护之道

在现代化的大米生产过程中,自动化生产线的应用已经越来越广泛。其中,包装设备作为生产线上的重要一环,其选择与维护直接关系到产品的质量和生产效率。与星派一起探讨大米自动化生产线中包装设备的选择与维护之道。 一、包装设备的选择 在选择…

工厂模式应用实例

引言 设计模式概念 设计模式(Design Pattern)的官方概念可以表述为:在软件设计中,设计模式是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。它是针对特定问题或特定场景的解决方案,是一种经过…

单元测试之TestNG知识点总结及代码示例

TestNG 是一个测试框架,用于自动化测试 Java 和 Scala 应用程序,它是 JUnit 和 NUnit 的一个强大替代品。TestNG 支持数据驱动测试、参数化测试、测试套件、依赖管理、多线程测试等特性。TestNG官网:TestNG Documentation 目录 1.TestNG 基…

虹科Pico汽车示波器 | 免拆诊断案例 | 2010款凯迪拉克SRX车发动机无法起动

故障现象 一辆2010款凯迪拉克SRX车,搭载LF1发动机,累计行驶里程约为14.3万km。该车因正时链条断裂导致气门顶弯,大修发动机后试车,起动机运转有力,但发动机没有着机迹象;多起动几次,火花塞会变…

网络编程:服务器模型-并发服务器-多进程

并发服务器概念: 并发服务器同一时刻可以处理多个客户机的请求 设计思路: 并发服务器是在循环服务器基础上优化过来的 (1)每连接一个客户机,服务器立马创建子进程或者子线程来跟新的客户机通信 (accept之后…

QT--4

QT 使用定时器完成闹钟 #include "widget.h" #include "ui_widget.h"void Widget::timestart() {timer.start(1000); }void Widget::timeend() {timer.stop(); }Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(t…

分类预测 | Matlab实现DBO-CNN-SVM蜣螂算法优化卷积神经网络结合支持向量机多特征分类预测

分类预测 | Matlab实现DBO-CNN-SVM蜣螂算法优化卷积神经网络结合支持向量机多特征分类预测 目录 分类预测 | Matlab实现DBO-CNN-SVM蜣螂算法优化卷积神经网络结合支持向量机多特征分类预测分类效果基本描述程序设计参考资料 分类效果 基本描述 1.Matlab实现DBO-CNN-SVM蜣螂算法…

【卫星影像三维重建-全流程代码实现】点云Mesh重构

点云—>Mesh模型 1.介绍1.1 背景1.2 效果示意 2 算法实现2.1 依赖库2.2 实验数据2.3 代码实现2.4 实验效果 3.总结 1.介绍 1.1 背景 (1)本文主要内容是将三维点云(离散的三维点)进行表面重建生成Mesh网格,之前有篇…

Middle for Mac:简洁高效的文本编辑软件

追求简洁与高效?Middle for Mac将是您文本编辑的最佳选择。这款Mac平台上的文本编辑器,以其独特的魅力和实用的功能,赢得了众多用户的喜爱。 Middle注重用户体验,采用简洁直观的界面设计,让您能够迅速上手并享受高效的…

巩固学习6

正则表达式 又称规则表达式,Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”&…

今天开发了一款软件,我竟然只用敲了一个字母(文末揭晓)

软件课题:Python实现打印100内数学试题软件及开发过程 一、需求管理: 1.实现语言:Python 2.打印纸张:A4 3.铺满整张纸 4.打包成exe 先看效果: 1. 2.电脑打印预览 3.打印到A4纸效果(晚上拍的&#x…

【实践】使用vscode来debug go程序的尝鲜

配置 首先,当然得配置好vscode 的go环境, 装个go插件就基本满足了 配置 launch.json, 可以配置多个环境的程序启动参数(很友好) {"version": "0.2.0","configurations": [{"name": &…

享元模式详解

享元模式 1 概述 定义: ​ 运用共享技术来有效地支持大量细粒度对象的复用。它通过共享已经存在的对象来大幅度减少需要创建的对象数量、避免大量相似对象的开销,从而提高系统资源的利用率。 2 结构 享元(Flyweight )模式中存…

linux学习:视频输入+V4L2

目录 V4L2 视频采集流程 代码例子 核心命令字和结构体 VIDIOC_ENUM_FMT VIDIOC_G_FMT / VIDIOC_S_FMT / VIDIOC_TRY_FM VIDIOC_REQBUFS VIDIOC_QUERYBUF VIDIOC_QBUF /VIDIOC_DQBUF VIDIOC_STREAMON / VIDIOC_STREAMOFF V4L2 是 Linux 处理视频的最新标准代码模块&…

力扣HOT100 - 45. 跳跃游戏 II

解题思路&#xff1a; 贪心 class Solution {public int jump(int[] nums) {int end 0;int maxPosition 0;int steps 0;for (int i 0; i < nums.length - 1; i) {maxPosition Math.max(maxPosition, i nums[i]);if (i end) {end maxPosition;steps;}}return steps;…

Java | Leetcode Java题解之第86题分隔链表

题目&#xff1a; 题解&#xff1a; class Solution {public ListNode partition(ListNode head, int x) {ListNode small new ListNode(0);ListNode smallHead small;ListNode large new ListNode(0);ListNode largeHead large;while (head ! null) {if (head.val < x…

java sql中 大于 小于 大于等于 小于等于 代替符号

在写java时sql会经常会忘记大于小于号的表示方法导致无法运行&#xff0c;总结一下 第一种方法&#xff1a; < &#xff1a;< < &#xff1a; < &#xff1a;> &#xff1a; > sql如下&#xff1a; create_at > #{startTime} and create_at < #{end…

Linux系统编程:进程控制

1.进程创建 1.1 fork函数 fork&#xff08;&#xff09;通过复制调用进程来创建一个新进程。新进程称为子进程&#xff0c;是调用进程的精确副本 进程&#xff0c;但以下几点除外&#xff1a; 子进程有自己的PID&#xff0c;此PID与任何现有进程组的ID不匹配子进程的父进程ID…

【全开源】废品回收微信小程序基于FastAdmin+ThinkPHP+UniApp

介绍 一款基于FastAdminThinkPHPUniApp开发的废品回收系统&#xff0c;适用废品回收站、再生资源回收公司上门回收使用的小程序 功能特性 1、会员注册 支持小程序授权注册和手机号注册 2、回收品类 可设置回收品类&#xff0c;废纸、废金属、废玻璃、旧衣服等 3、今日指导价…