【Python】Dejavu:Python 音频指纹识别库详解

在这里插入图片描述

Dejavu 是一个基于 Python 实现的开源音频指纹识别库,主要用于音频文件的识别和匹配。它通过生成音频文件的唯一“指纹”并将其存储在数据库中,来实现音频的快速匹配。Dejavu 的主要应用场景包括识别音乐、歌曲匹配、版权管理等。

在这里插入图片描述
华丽的分割线

⭕️宇宙起点

    • 💯 Dejavu 的工作原理
    • 📦 如何安装和配置 Dejavu
    • ♨️ 基本用法和代码示例
      • 1)创建 Dejavu 实例并进行音频指纹匹配
      • 2)通过麦克风进行音频识别
    • 🔨 高级功能和配置
    • ❓ 常见问题和注意事项
    • 📥 下载地址
    • 💬 结语
    • 📒 参考文献


标题1

💯 Dejavu 的工作原理

Dejavu 使用“音频指纹”技术来识别音频文件。指纹是音频的独特特征,通过快速傅里叶变换(FFT)提取频率峰值,并使用哈希算法将这些峰值数据转换为唯一的指纹值。然后,这些指纹被存储到数据库中,方便后续的匹配和查询。

  • 音频指纹生成:通过频率变换和特征提取算法生成音频的哈希值,并存储到数据库。
  • 音频识别:将输入的音频文件生成指纹并与数据库中现有的指纹进行匹配。

标题2

📦 如何安装和配置 Dejavu

要安装 Dejavu,您可以使用以下步骤:

  1. 安装 Python 依赖:

    pip install dejavu
    
  2. 设置数据库(MySQL 或 PostgreSQL)并创建存储音频指纹的表:

    mysql -u root -p
    CREATE DATABASE dejavu;
    
  3. 配置 dejavu.cnf.SAMPLE 文件(可重命名为 dejavu.cnf):

    {"database": {"host": "127.0.0.1","user": "root","password": "your_password","database": "dejavu"},"database_type": "mysql"
    }
    

标题3

♨️ 基本用法和代码示例

Dejavu 提供了多种识别音频的方式,包括从文件识别、通过麦克风识别等。以下是几个常用的代码示例:

1)创建 Dejavu 实例并进行音频指纹匹配

from dejavu import Dejavu
from dejavu.logic.recognizer.file_recognizer import FileRecognizer# 加载配置文件
config = {"database": {"host": "127.0.0.1","user": "root","password": "your_password","database": "dejavu"},"database_type": "mysql"
}
djv = Dejavu(config)# 对文件目录中的音频文件进行指纹生成
djv.fingerprint_directory("mp3_directory", [".mp3"])# 从音频文件中进行识别
result = djv.recognize(FileRecognizer, "mp3/Josh-Woodward--I-Want-To-Destroy-Something-Beautiful.mp3")
print(f"识别结果: {result}")

2)通过麦克风进行音频识别

from dejavu.logic.recognizer.microphone_recognizer import MicrophoneRecognizer# 使用麦克风进行识别,持续监听 10 秒钟
result = djv.recognize(MicrophoneRecognizer, seconds=10)
if result:print(f"麦克风识别结果: {result}")
else:print("未识别到任何内容,请确认是否播放了歌曲。")

标题4

🔨 高级功能和配置

Dejavu 提供了多种配置选项,可以通过修改 config/settings.py 中的参数进行调优。以下是一些常用的高级配置:

参数描述默认值
FINGERPRINT_REDUCTION控制指纹的精度,值越小精度越高30
PEAK_NEIGHBORHOOD_SIZE峰值邻域的大小,影响指纹的唯一性和匹配准确度10
DEFAULT_OVERLAP_RATIO指纹片段的重叠比率0.4
DEFAULT_FAN_VALUE控制特征点连接的数目,影响匹配的敏感度和计算量5
DEFAULT_AMP_MIN设置指纹的最小振幅,控制噪声过滤10

通过调整这些参数,用户可以在识别速度与识别准确度之间找到一个最佳平衡点。


标题5

❓ 常见问题和注意事项

  1. Python 版本兼容性:Dejavu 最初是为 Python 2.x 编写的,后续更新支持了 Python 3.x 版本。使用 Python 3 版本时可能需要注意一些依赖库的版本兼容性,如 Numpy 的特定版本。
  2. 数据库选择:目前 Dejavu 支持 MySQL 和 PostgreSQL 作为音频指纹存储的数据库,用户可以根据自己的需求选择合适的数据库类型。
  3. 麦克风识别:使用麦克风识别时,确保麦克风设备正常工作,并且在录制时播放歌曲以便进行匹配。

标题6

📥 下载地址


Dejavu 最新版 下载地址


标题7

💬 结语

Dejavu 是一个功能强大的音频指纹识别库,特别适合需要音频文件识别、歌曲匹配的项目。在实际使用中,通过合理配置数据库和指纹生成参数,可以提高系统的识别精度和效率。对于开发者来说,Dejavu 提供了简单易用的 API,并支持多种识别场景,非常适合在 Python 项目中集成音频识别功能。


标题8

📒 参考文献

  • Dejavu GitHub仓库

TheEnd


在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/439356.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

class 004 选择 冒泡 插入排序

我感觉这个真是没有什么好讲的, 这个是比较简单的, 感觉没有什么必要写一篇博客, 而且这个这么简单的排序问题肯定有人已经有写好的帖子了, 肯定写的比我好, 所以我推荐大家直接去看“左程云”老师的讲解就很好了, 一定是能看懂的, 要是用文字形式再写一遍, 反而有点画蛇添足了…

windows下安装rabbitMQ并开通管理界面和允许远程访问

如题,在windows下安装一个rabbitMQ server;然后用浏览器访问其管理界面;由于rabbitMQ的默认账号guest默认只能本机访问,因此需要设置允许其他机器远程访问。这跟mysql的思路很像,默认只能本地访问,要远程访…

Oracle架构之表空间详解

文章目录 1 表空间介绍1.1 简介1.2 表空间分类1.2.1 SYSTEM 表空间1.2.2 SYSAUX 表空间1.2.3 UNDO 表空间1.2.4 USERS 表空间 1.3 表空间字典与本地管理1.3.1 字典管理表空间(Dictionary Management Tablespace,DMT)1.3.2 本地管理方式的表空…

计算机网络(十) —— IP协议详解,理解运营商和全球网络

目录 一,关于IP 1.1 什么是IP协议 1.2 前置认识 二,IP报头字段详解 三,网段划分 3.1 IP地址的构成 3.2 网段划分 3.3 子网划分 3.4 IP地址不足问题 四,公网IP和私有IP 五,理解运营商和全球网络 六&#xff…

基于大数据技术的颈椎病预防交流与数据分析及可视化系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码 精品专栏:Java精选实战项目…

【优选算法】(第二十一篇)

目录 外观数列(medium) 题目解析 讲解算法原理 编写代码 数⻘蛙(medium) 题目解析 讲解算法原理 编写代码 外观数列(medium) 题目解析 1.题目链接:. - 力扣(LeetCode) 2.题目描述 给定⼀个正整数n&#xff0…

算法篇1:双指针思想的运用(1)--C++

一.算法解析 双指针,顾名思义就是两个指针,常见的算法中,我们可以看到两种: 1.对撞指针:一般用于顺序结构,也称为左右指针。 对撞指针从两端向中间移动。一个指针从最左端开始,另一个从最右端…

Yolov8轻量级网络改进GhostNet

1,理论部分 由于内存和计算资源有限,在移动设备上部署卷积神经网络 (CNN) 很困难。我们的目标是通过利用特征图中的冗余,为 CPU 和 GPU 等异构设备设计高效的神经网络,这在神经架构设计中很少被研究。对于类 CPU 设备,我们提出了一种新颖的 CPU 高效 Ghost (C-Ghost) …

Mysql:数据库和表增删查改基本语句

一、数据库操作 1)、数据库创建 创建数据库本质就是创建一个目录(ubuntu,创建的目录文件存放在/var/lib/mysql);后续创建表本质就是在该目录下创建文件(不同存储引擎,会创建的文件数目是不同的…

PASCAL VOC 2012数据集 20类物体,这些物体包括人、动物(如猫、狗、鸟等)、交通工具(如车、船、飞机等)以及家具(如椅子、桌子、沙发等)。

VOC2012数据集是PASCAL VOC挑战赛官方使用的数据集之一,主要包含20类物体,这些物体包括人、动物(如猫、狗、鸟等)、交通工具(如车、船、飞机等)以及家具(如椅子、桌子、沙发等)。每个…

计算机网络:物理层 —— 物理层下的传输媒体

文章目录 传输媒体导向性媒体同轴电缆双绞线光纤光纤分类中心波长光纤规格光纤的优缺点 非导向性媒体ISM 频段无线电波微波激光红外线可见光 传输媒体 传输媒体是计算机网络设备之间的物理通路,也称为传输介质或传输媒介,并不包含在计算机网络体系结构中…

github项目——系统设计入门

今天的github趋势,有几个项目印象感觉很有意思,之后可能会用的上,记录一下 系统设计入门 书籍教程类项目,有中文文档,刚好需要。 https://github.com/donnemartin/system-design-primer/blob/master/README-zh-Hans.md…

Linux之实战命令26:timeout应用实例(六十)

简介: CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布:《Android系统多媒体进阶实战》🚀 优质专栏: Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏: 多媒体系统工程师系列【…

postgresql|数据库|postgis编译完成后的插件迁移应该如何做(postgis插件最终章)

一、 本文的写作理由 postgis插件一般是编译安装,编译安装的原因是可以选择自己喜欢的版本,但编译的难度也是比较高的,因为有各种依赖,依赖之间还有依赖,非常容易形成依赖循环,因此,失败率是比…

libevent框架、带缓冲区事件bufferevent的使用

1.简介 特点 源码包安装 2.libevent框架 创建event_base 创建添加事件 循环监听事件满足 释放event_base 相关函数了解 3.常规事件event 未决与非未决 使用fifo的读写 4.带缓冲区事件bufferevent bufferevent A.服务器创建监听器 C.给读写缓冲区设置回调 D.禁用…

基于spring boot的篮球论坛系统

作者:计算机搬砖家 开发技术:SpringBoot、php、Python、小程序、SSM、Vue、MySQL、JSP、ElementUI等,“文末源码”。 专栏推荐:SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:Java精选实战项…

【Unity踩坑】使用内购时获取Google Play license key

在Unity中使用了IAP(内购)后,需要设置Google Play license key。 这个key需要在Google Play Console中(https://play.google.com/console),找到相应的应用,在左侧“创收设置”里可以找到license…

电脑失声,一招搞定

早已习惯了Edge浏览器的“大声朗读”功能,今天值班,值班室用的两台电脑只配有耳机,没有音箱,顿时感觉不适。 先找了一个带功放的老音箱,发现少了电箱到功放的音频线。 一顿搜索,在找到音频线的同时&#…

Linux·进程概念(下)

1. 进程优先级 优先级就是获得某种资源的先后顺序,因为CPU资源是有限的,因此各个进程之间要去争取CPU的资源。 那么针对Linux操作系统下的PCB中,也就是task_struct结构体中,使用了int类型的变量记录了每个进程的优先级属性&#x…

【Xcode Command Line Tools】安装指南

安装指令 xcode-select --install安装 完成安装 验证 $ xcode-select -p /Library/Developer/CommandLineTools