DTW算法,与matlab自带算法类似,只是不需要转置矩阵了。(但是二者算出的值不一样,具体效果待测)
2023-11-10 09:11:45 661B 语音识别
1
本文实例为大家分享了梅尔倒谱系数实现代码,供大家参考,具体内容如下 @author: zoutai @file: mymfcc.py @time: 2018/03/26 @description: from matplotlib.colors import BoundaryNorm import librosa import librosa.display import numpy import scipy.io.wavfile from scipy.fftpack import dct import matplotlib.pyplot as plt import numpy
2023-04-07 21:49:49 56KB mfcc signal
1
MATLAB首先对语音进行不同的非线性自适应时频分析的去噪,然后提取MFCC、GFCC、LPCC等特征,最后通过随机森林,对音标进行分类注1:音频文件数据集;注2:一行代码自动添加文件和子文件到路径;
2023-04-03 10:29:31 4KB matlab
1
mfcc特征提取的matlab代码此软件包已弃用,不再维护,请改用神农: 安装: 简而言之,如果所有依赖项都安装在系统上,则可以在cli内安装feature_extraction : python setup.py build && python setup.py install 如果使用conda从源代码安装并且未安装依赖项,则可以执行以下操作: 来自github的gget feature_extraction : >> git clone https://github.com/bootphon/features_extraction 创建您的环境,例如,如果使用conda(使用来自的python 2.7 64-BIT) >> cd features_extraction >> conda create --name feat --file requirements.txt >> source activate feat 安装conda不可用的其他依赖项 (feat) >> pip install oct2py (feat) >> pip install git+http://git
2023-03-29 15:01:14 10.88MB 系统开源
1
本源程序代码的目的是给出语音情感计算的概况以及最新进展,探讨语音情感计算的整个过程。首先,介绍了语音情感计算的定义以及它的交叉学科的本质。接下来,从数字信号处理的角度研究了基于最常用的数字语音信号特征——MFCC的语音情感检测的全过程。然后,利用柏林语音情感数据库分析了在提取MFCC的过程中一些具体的参数的选择对检测结果准确率的影响。最后,阐述了语音情感计算领域面临的挑战以及今后的可能发展趋势。 用的是柏林语音情感数据库,最终的识别率勉强接近50%,存在的问题我也思考了,但是一时解决不了。
2022-12-21 13:42:55 20KB 语音情感识别
1
基于Keras+python实现的声纹识别系统完整源码(可训练和测试)+带数据集+训练好的模型+项目说明.7z 【项目】基于深度学习的声纹识别 【主要功能】 通过声音识别人物 实现原理(流程): 音频 → 提取语音特征(FFT、Mel过滤、MFCC)→ CNN&GRU → Triplet loss损失函数训练 + 预训练 + 训练得结果
2022-12-14 16:26:54 838.53MB 声音识别 python源码 keras源码 MFCC
利用预加重、分帧等功能,实现语音信号MFCC提取
2022-11-09 08:54:18 22.46MB 实验一语音信号MFCC特征提取 MFCC
1
matlab倒错代码MFCC处理数字识别系统 这是华盛顿大学电气工程 DSP 集中的 Capstone 项目。 字幕: 神经网络; 机器学习; MFCC; 语音识别; 音频分类; 细节: 它是一个实时音频数字识别系统。 它包含 2500 个用于训练和测试的音频数据,1500 个来自公共数据集,100 个来自大学志愿者。 为了处理输入音频的不同音量和长度,我使用了梅尔频率倒谱系数(MFCC)来提取输入音频的特征,成功地将数据维度减少了 1 到 34,同时保持了频率网络训练的特征。 最后,我为训练部分实现了前馈神经网络,并对其进行了微调以获得良好的结果。 结构体: 这个Repo主要包含两部分代码: Matlab 代码用于计算音频信号的 MFCC。 Python 代码是前馈神经网络的实现。
2022-11-04 11:37:56 72.78MB 系统开源
1
该算法将语音样本分成fame,然后计算每帧的mfcc并存储在矩阵中
2022-10-25 15:19:53 2KB matlab
1
对输入的语音序列x进行MFCC参数的提取,返回MFCC参数和一阶差分MFCC参数,Mel滤波器的阶数为24,fft变换的长度为256,采样频率为8000Hz,对x 256点分为一帧.
2022-10-21 21:33:30 4KB mfcc mfcc_一阶 mel mfcc_差分
1