基于GRNN广义回归网络和MFCC的语音情绪识别matlab仿真,对比SVM和KNN

目录

1.算法运行效果图预览

2.算法运行软件版本

3.部分核心程序

4.算法理论概述

5.算法完整程序工程


1.算法运行效果图预览

(完整程序运行后无水印)

filePath =

    'Test_data\悲伤1.wav'

类型:悲伤
识别置信度

Vmax =

    0.9559

2.算法运行软件版本

matlab2022a

3.部分核心程序

(完整版代码包含详细中文注释和操作步骤视频)

..................................................................
Labsn   = [];
% 遍历每种情绪
for i = 1:length(Em_kind)Labs0 = Em_kind(i); % 当前情绪标签trainfile = dir(['train_data/' char(Labs0), '\*.wav']); % 获取当前情绪的所有 WAV 文件Num_wav = length(trainfile(not([trainfile.isdir]))); % 计算有效 WAV 文件的数量% 遍历每个 WAV 文件for j = 1:Num_wav[ywav, Fs] = audioread(['train_data/' char(Labs0) '/' char(lower(Labs0)) int2str(j) '.wav']); % 读取音频文件% 计算 MFCC 特征[Fmfcc, ~, ~, H] = func_MFCC(ywav, Fs, Lframe, LShift, Fpre, @hamming, [fre_min fre_max], Nch, Cep_coff + 1, Cep_Sine);% 将当前文件的 MFCC 特征添加到训练数据集中Dat_trainset = [Dat_trainset; Fmfcc'];% 将当前文件的标签添加到标签集中Labs = [Labs; repmat(cellstr(Labs0), size(Fmfcc, 2), 1)];Labsn= [Labsn;repmat(i, size(Fmfcc, 2), 1)];end
end% 训练 KNN 模型
model1 = fitcknn(Dat_trainset, Labs); % 标准化数据并训练 KNN 模型% 训练多类分类模型
model2 = fitcecoc(Dat_trainset, Labs); % 训练多类分类模型%GRNN
model3 = newgrnn(Dat_trainset',Labsn',5);% 保存模型
save model.mat model1 model2 model3; % 将模型保存到文件中
179

4.算法理论概述

       语音情绪识别是人工智能和信号处理领域中的一个重要研究方向。它旨在通过分析语音信号中的特征,识别出说话人的情绪状态,如高兴、悲伤、愤怒、恐惧等。随着人工智能技术的不断发展,语音情绪识别在人机交互、心理健康监测、客户服务等领域具有广泛的应用前景。

梅尔频率尺度:

       人耳对声音的感知不是线性的,而是在频率上呈现出一种非线性的关系。梅尔频率尺度是一种基于人耳听觉特性的频率尺度,它将频率转换为梅尔频率,使得人耳对不同频率的声音具有相似的感知。

MFCC 特征提取过程:

预加重:对输入的语音信号进行预加重处理,以增强高频部分的能量。预加重可以通过以下公式实现:,其中为输入的语音信号,为预加重后的信号,为预加重系数,通常取。

分帧:将语音信号分成若干个短时段,称为帧。每一帧的长度通常为 20-40ms,相邻帧之间有一定的重叠。

加窗:对每一帧信号进行加窗处理,以减少帧边界处的不连续性。常用的窗函数有汉明窗、汉宁窗等。

快速傅里叶变换(FFT):对加窗后的每一帧信号进行快速傅里叶变换,得到其频谱。

计算梅尔滤波器组能量:将频谱通过一组梅尔滤波器组,得到每个滤波器的输出能量。梅尔滤波器组是一组在梅尔频率尺度上均匀分布的带通滤波器,其数量通常为 20-40 个。

对数运算:对每个滤波器的输出能量取对数,得到对数梅尔滤波器组能量。

离散余弦变换(DCT):对对数梅尔滤波器组能量进行离散余弦变换,得到 MFCC 系数。DCT 可以将信号从时域转换到频域,同时具有良好的能量压缩性能。

GRNN 广义回归网络原理

GRNN 是一种基于径向基函数(Radial Basis Function,RBF)网络的改进型神经网络。它由输入层、模式层、求和层和输出层组成。

输入层:接收输入向量,其中为输入向量的维度。

模式层:每个神经元对应一个训练样本,其输出为输入向量与训练样本之间的距离的函数。常用的距离函数有欧氏距离、曼哈顿距离等。

求和层:由两个神经元组成,分别计算模式层输出的加权和。一个神经元计算模式层输出的算术和,另一个神经元计算模式层输出的加权和。

输出层:输出为求和层输出的函数,通常为线性函数。

5.算法完整程序工程

OOOOO

OOO

O

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/448773.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue2路由

1.路由 1.1.Vue路由基础 Vue属于单页应用(SPA),即整个应用程序中只有一个html页面。 在单页应用中(SPA),由于只是更改DOM来模拟多页面,所以页面浏览历史记录的功能就丧失了。此时&#xff0c…

nextjs项目中,使用postgres的完整案例

目的 通过此案例,可以简单快速的过一下数据库的操作,熟悉app-router这种模式下,client component和server component的两种组件中基本的接口使用。 技术栈 nextjs14.2.* app-routervercel/postgres0.10.*typescript5 重要事情说三遍1 ap…

uni-app写的微信小程序如何体积太大如何处理

方法一:对主包进行分包处理,将使用url: /pages/components/equipment/equipment跳转页面的全部拆分为分包,如url: /pagesS/components/equipment/equipment 在pages.json中添加 "subPackages": [{ "root"…

antd样式修改

1.Tab添加竖线 .ant-tabs .ant-tabs-tab {&::before {position: absolute;top: 50%;inset-inline-end: 0;width: 1px;height: 24px;background-color: #e1e1e1;transform: translateY(-50%);transition: background-color 0.2s;content: "";}} 像这样&#xff…

基于SSM的药品商城系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…

科研绘图系列:R语言柱状图(histogram)

文章目录 介绍加载R包数据画图系统信息介绍 柱状图(Bar Chart),也称为条形图(Bar Graph),是一种常用的统计图表,用于展示不同类别的数据量。它由一系列垂直或水平的条形组成,每个条形的长度或高度代表相应类别的数值大小。 加载R包 library(tidyverse)# 显示中文 li…

增量知识 (Incremental Knowledge, IK)

在语义通信系统中,增量知识(IK, Incremental Knowledge)是一种增强数据传输效率和可靠性的技术,特别是用于混合自动重传请求(HARQ, Hybrid Automatic Repeat reQuest)机制时。它的核心思想是在传输失败后&a…

Android 15 推出新安全功能以保护敏感数据

Android 15 带来了增强的安全功能,可保护您的敏感健康、财务和个人数据免遭盗窃和欺诈。 它还为大屏幕设备带来了生产力改进,并对相机、消息和密钥等应用进行了更新。 Android 防盗保护 Google 开发并严格测试了一套全面的功能,以在盗窃之…

Stable Diffusion Web UI 大白话术语解释 (二)

归纳整理,Stable Diffusion Web UI 使用过程中,相关术语 ControlNet ControlNet 说简单点,就是你可以给 AI 一些“规则”,比如让它根据某些线条、结构或者骨架去画图。 这样能让 AI 画出更符合你要求的图片,特别适合画…

将爱传递 将“服务好”延伸

从泰康客户,转身成为泰康人,她直言是因为亲身感受了泰康“服务好”的魅力。 入司已8年的泰康养老浙江分公司HWP何英英,是泰康“服务好”的受益者。她从朋友的理赔中见证了泰康服务好的温度与力量,又被泰康养老的职域模式所吸引选择加入泰康。如今,她全身心投入在服务的第一线,…

PMP–知识卡片--项目生命周期与资源投入

预测型生命周期对变更并不友好,尤其是项目后期,变更代价太大,几乎让人无法接受。正如果所示,累计投入线代表项目累计的成本,也代表变更的代价。变更提出得越晚,代价越大。

实时语音转文字(基于NAudio+Whisper+VOSP+Websocket)

今天花了大半天时间研究一个实时语音转文字的程序,目的还包括能够唤醒服务,并把命令提供给第三方。 由于这方面的材料已经很多,我就只把过程中遇到的和解决方案简单说下。源代码开源在AudioWhisper: 实时语音转文字(基于NAudioWhisperVOSPWe…

1.几何算法-凸包

1.凸包的例子 1.1.简单求解 当着手设计一个计算凸包的算法时,此前所给出的凸包定义对我们没有多少帮助。按照定义,需要计算出“包含 P 的所有凸集的交”,可是这种集合有无限多个。而我们所观察到的“CH是一个凸多边形”这一事实&#xff0c…

libaom 源码分析:aomdec.c 文件

aomdec.c 功能:libaom 项目完成视频解码过程的 demo文件位置:libaom/apps/aomdec.c函数关系 命令行说明 终端输入 ./aomdec --help,输出如下,展示如何使用方法。Usage: ./aomdec <options> filenameOptions:--help Show usage options and exit…

pico+Unity交互开发——触碰抓取

一、VR交互的类型 Hover&#xff08;悬停&#xff09; 定义&#xff1a;发起交互的对象停留在可交互对象的交互区域。例如&#xff0c;当手触摸到物品表面&#xff08;可交互区域&#xff09;时&#xff0c;视为触发了Hover。 Grab&#xff08;抓取&#xff09; 概念&#xff…

Qt_软件添加版本信息

文章内容: 给生成的软件添加软件的版权等信息 #include <windows.h> //中文的话增加下面这一行 #pragma code_page(65001)VS_VERSION_INFO VERSIONINFO

基于Arduino的简易收音机

DIY FM收音机&#xff1a;使用Arduino和Si4703模块打造 引言 在本项目中&#xff0c;我们将使用Arduino Nano和Si4703 FM调谐模块来构建一个功能完备的FM收音机接收器。这个易于跟随的指南非常适合想要深入无线电频率和无线通信世界的业余爱好者和电子爱好者。 Si4703模块是…

cuda编程模型

host和device&#xff1a; host&#xff1a;即CPU&#xff0c;CPU所关联的内存就叫host memorydevice&#xff1a;即GPU&#xff0c;GPU内的内存就叫device memory运行CUDA程序主要有三步&#xff1a;1&#xff09;host-to-device transfer&#xff1a;将数据从host memory拷到…

python基于大数据的电影市场预测分析

一、摘要 智慧是改变生活和生产的一种来源&#xff0c;那么智慧的体现更大程度上是对于软件技术的改变。当今社会&#xff0c;好的思路&#xff0c;好的创新方式往往是改变人们生活的一种来源。最常见最直接的形式就是各种软件的创始思路&#xff0c;京东因为非典的流行才能够…

【Java知识】java进阶-反射的原理以及实现

文章目录 反射的原理类对象继承图反射的使用注意事项 Java反射机制是Java语言的一个特性&#xff0c;它允许程序在运行时动态地加载、探查、使用编译期间完全未知的类。反射机制使得Java程序可以处理一些在编译时并不确定的类&#xff0c;增加了程序的灵活性。 反射的原理 类的…