只需 1 分钟,这个网站用 AI 分离歌曲的人声、伴奏和乐器声

整理:Just

出品:AI科技大本营(ID:rgznai100)

疫情期间,在家待着闲来无事,一些技术人员就喜欢以技术的方式找点乐子,顺带赚钱最好了。

将歌曲中的人声和乐器声分离是一件让想使用音乐伴奏的人头疼的事情,传统的音乐制作软件使用门槛较高,处理起来不光费时而且效果不一定好。

团子DanGo.ai(https://dango.ai/)——微博网友@无吔学生近期利用AI技术做的这个能分离音频轨道的网站火了。

在音乐分离这一领域,实际上已经有一些免费的AI工具。比如,由法国音乐流媒体服务公司Deezer为研究目的而开发的Spleeter开源工具,只需要提供一个音频文件,然后Spleeter就会将它分成两个、四个或五个独立的音轨,非常有用。

团子DanGo.ai就是基于Spleeter开源工具做的。利用AI技术并通过上千首歌曲数据的训练,用户只需要上传歌曲,等待1分钟,目前就可以提取歌曲中的伴奏、人声、钢琴、贝斯、鼓点等多音轨压缩文件,效果要好于Au或者GoldWave之类的传统音频处理软件。

@无吔学生表示,这是他秃了一个月头的成果。

据网站作者介绍。团子主要由基于MIT协议的开源项目Spleeter制作的,同时在其之上增加了一些功能魔改使效率与音质得到提升。团子基于深度神经网络(DNN)实现的音轨分离所诞生的人工智能,它使用Python/Tensorflow开发。

那么,团子 DanGo.ai 与传统的音乐分离软件有什么不同?

一般而言,传统音乐分离软件所谓的“消音”一般是简单的带阻滤波,用人话说就是把人声所在的频率直接暴力擦除,这就会导致消音后的歌曲变得特别“糊”——表现为鼓点、某些乐器的消失。作者解释,这是因为人声会和某些相同频率的乐器重叠,单纯的抠除这个频率,不光会消除人声,也会消除在这个频率里的乐器。而根据歌曲的不同,人声/和声所在的频率也并非固定,这就导致提取出的伴奏不但效果糟糕,而且仍然带着部分残余的人声。

“当然,也有一些人发现,歌曲中的人声录音一般是单声道的,而歌曲的乐器未必是这样。于是人们也尝试使用左右声道“相减”(如Au中的中置声道提取器)来提取伴奏或人声。但是提取的效果基本仍然很差,因为无法保证乐器不是多声道的,也无法保证人声是否被混音师加了后期处理效果器而变成多声道,所以它并不适合多数歌曲(尤其是现代音乐)。”

作者称,团子DanGo.ai 则不用考虑上述让人心智损伤的事情。该软件用了大量的音乐数据进行训练,“我们可以把团子想象成一个大脑——我们让它听了非常多的歌曲用来“训练”它。现在它非常懂得歌曲,理解歌曲中各个乐器的存在,也能谨慎细心的剥离开人声和伴奏,从而最大程度的保留各个音轨的质量。”

目前,用户可用团子 DanGo.ai 网站试听5首分离的多音轨歌曲。当然,如果你想要更多高质量的生成歌曲还需付费,付费歌曲会保留30天的歌曲文件让用户下载。

最后给出作者的制作网站的一个demo视频,可以听出歌曲不同多音轨的效果,你感受下?

RECOMMEND

             

  AI社群  

                

AI感兴趣的小伙伴,

网易智能12个不同垂直领域社群等你加入
添加智能菌微信:kaiwu_club

和我们一起探讨AI的故事~

你有没有“在看”鸭?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/37810.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【音乐生成】乐谱生成

文章目录 介绍与研究动机数据集方法实验结果 介绍与研究动机 论文链接:AN EXPLORATION OF GENERATING SHEET MUSIC IMAGES 传统的音乐生成任务的输出格式以MIDI、WAV为主,本文研究的格式却是乐谱,那么乐谱形式的音乐相较MIDI格式的音乐有哪些…

宠物喂食器,基于涂鸦智能的解决方案

宠物喂食器,基于涂鸦智能的解决方案 作品描述作品介绍硬件部分软件部分 开发流程代码编写1. 产品创建2. MCU SDK 移植3. 时间系统实现4. 快速喂食功能实现5. 余粮检测功能6. 已出粮剩余量检测功能7. 计划喂食功能实现8. 手动喂食功能实现9. 小夜灯功能实现10. 语音控…

读书笔记——《2001太空漫游》

阿瑟克拉克神作,任何一个科幻迷都绕不开的一部作品。很早就听说过其大名,因为之前看过电影版的,总感觉少了点新鲜感,这本书就一直在书架上没有拿出来看。但是看过这本书后,我可以很负责任的说,全书都充满新…

仿PC端小红书主页

前端基础阶段 用原生的html和css来写页面是几乎每个初学前端的人第一次接触前端做的事,写出一个好看的前端页面也能让你成就感爆棚,小红书界面用视频做背景看起来高大上其实也是非常简单的几句代码能搞定的具体的如下 小红书页面详情 仿小红书页面,用纯…

chatgpt赋能python:Python海龟图:如何将海龟进行编程,并让它转起来

Python海龟图:如何将海龟进行编程,并让它转起来 Python中的海龟图(Turtle Graphics)是一种基本的图形绘制方法。通过编写Python代码,我们可以控制“海龟”来画出我们需要的任何图形。本文将介绍如何使用Python海龟图绘制旋转的图形&#xff…

TCP通信客户端和服务器端网络编程

一 客户端和服务器端通信的步骤 二 TCP通信的客户端网络编程 TCP协议是严格区分客户端和服务器端的 1. TCP通信的客户端 向服务器端发送连接请求给服务器端发送数据读取服务器端回写的数据 2. 在Java中,提供了java.net包下的Socket类来表示客户端。Socket也叫&q…

收发Hotmail和Yahoo邮件

Hotmail和Yahoo作为国际性的电子邮箱提供商,凭借着完全免费的服务策略和优良的稳定性吸引了大量的用户。可是无法直接用Foxmail等邮件客户端软件收发Hotmail和Yahoo邮箱中的邮件也一直是一个困扰大家的问题。其实,只要进行一些必要的设置,我们…

记录下javaMail发送邮件遇到的问题-(邮件中文昵称)

最近在做邮箱功能,其中发件时也需要记录下邮箱的昵称,所以代码中的邮箱地址前会有中文昵称,这也导致邮件发送失败 后台显示邮件发送成功,但是却被退回 Mail delivery failed: returning message to sender 其中,收件地…

格子达ai辅助降重:查看相关的ai报告

五月毕业季,很多同学都会出现ai辅助过高的情况,但是学校的格子达里面却没有ai句子分析。接下来告诉大家如何免费使用ai分析: 一、第一步点击下方连接注册一个自己的账号 https://www.gezida.com//checkReport/aiShare.do?sourceKeyd924bb0…

GTC 火山引擎线上专场 | 解码字节跳动多场景技术内核及应用

活动简介 12 月 19 日,GTC 智能增长技术专场,火山引擎将以「智能增长」为主题,为大家带来字节跳动在机器学习领域沉淀的技术经验,智能平台、数据智能、语音识别、联邦学习等场景的前沿应用,以及通过火山引擎这一平台在…

元宇宙新星升起,华英会加入NFT混战

如果说起2021这一年,那么有两个关键词一定会被提及,“新冠疫情”以及“元宇宙”,除了路人皆知的诸如facebook这样的互联网巨头们纷纷抢占风口,扩张地盘之外,通过相关区块链工具以及交易数据,我们还发现,一些低调的乃至神秘的公司及团体也正在这个新晋热点上,悄悄的开始了他们的…

专注于元宇宙实际应用方案的企业

元宇宙的话题持续火热。国内互联网大厂正在加大对元宇宙相关技术和应用的研发,元宇宙正在逐步成为创新创业的主战场。企业元宇宙在教育、会展、文创、旅游、博物馆、文化艺术、娱乐、社交、版权、零售等等领域发力,增加客户对企业的认同。 也许未来只需一…

Mixlab 在元宇宙盘了块 “地” 正式进军元宇宙

Mix 「 据 2022-1-19 微软官方新闻稿 」 微软(纳斯达克股票代码:MSFT)宣布收购游戏开发和互动娱乐内容发行商公司动视暴雪 Activision Blizzard Inc.(ATVI)。微软以每股 95.00 USD 的价格收购动视暴雪,总收…

c语言实现文件管理系统(对文本内内容操作)

文件管理系统 代码思路 1、利用两个文本文件,一个文本文件保存需要的数据,另一个保存需要处理的数据,对需要处理的文本内容进行最小值,最大值,平均值的求解。 2、把处理的数据存入数组,转化性质&#xff…

ChatGPT win下C语言串口通信

文章目录 1.ChatGPT2.对ChatGPT进行代码封装 关键词&#xff1a;win环境 C语言 串口通信 ChatGPT 1.ChatGPT - com<com9可以用直接赋值 COMx - com>com9需要 \\\\.\\COMx 重点//eg:COM1&#xff0c;COM2 , COM10 use \\\\.\\COM10ChatGPT&#xff1a;Write a serial c…

c#实现QQ群成员列表导出及邮件群发之模拟QQ登陆

前言 本文的重要部分&#xff1a; 1、抓包获取QQ空间或者邮箱登陆地址&#xff0c;分析参数&#xff0c;用户名&#xff0c;密码&#xff0c;验证码&#xff0c;gtk&#xff0c;随即数。 2、获取每次登陆需要的验证码 3、用户名&#xff0c;密码&#xff0c;验证码加密得到登陆…

快速导出qq群所有qq号码

打开http://qun.qq.com/member.html 登录自己的qq 登录以后的页面 选择要导出的qq群 然后按F12(打开开发者模式) 将下面的代码复制到控制台后敲回车执行即可。 function savefiles(data, name) {var urlObject = window.URL || window.webkitURL || window;var export_b…

​GPT-3好“搭档”:这种方法缓解模型退化,让输出更自然

文本生成对于许多自然语言处理应用来说都是非常重要的。 但神经语言模型的基于最大化的解码方法&#xff08;如 beam search&#xff09;往往导致退化解&#xff0c;即生成的文本是不自然的&#xff0c;并且常常包含不必要的重复。现有的方法通过采样或修改训练目标来引入随机…

技术创新,让企业拥有智能“伯乐”,实现精准识人

过去&#xff0c;“得人才者得天下&#xff0c;世有伯乐&#xff0c;然后有千里马。” 这些都是我们耳熟能详古人对于人才渴求的描写。能否及时发现人才、培养人才、发挥人才作用的关键&#xff0c;都是历代管理者或经营者关注的问题。自古发现人才并没有那么容易&#xff0c;过…

LLM in Medical Domain: 一文速览大语言模型在医学领域的应用

© 作者&#xff5c;杨锦霞 机构&#xff5c;中国人民大学 研究方向&#xff5c;多模态学习 来自&#xff1a;RUC AI Box 进NLP群—>加入NLP交流群 引言&#xff1a;近期&#xff0c;大型语言模型在各种任务上展现出优异的性能&#xff0c;展示了广阔的应用前景。然而&a…