为了使说话人识别系统在语音较短和存在噪声的环境下也具有较高的识别率, 基于矢量量化识别算法, 对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC )的提取相结合, 并将改进后的特征与谱质心 特征进行了组合, 建立了一种美尔频率小波变换系数+ 谱质心(MFWTC+ SC) 的新的组合特征参数。经实验表明, 该 组合特征可以有效地提高说话人识别系统的性能。
2023-04-15 16:18:16 185KB 说话人识别 特征提取
1
CASR-DEMO(中文自动语音识别演示系统) 关于本项目的一些说明 首先,欢迎大家关注项目,进行学习研究。收到一些小伙伴的问题我就集中回答下,这里是demo的源码,有两个版本其一是称为speech_env,这是一个简单的语音识别功能,界面如下面的效果图一;还有一个是V2.0的目录,这个版本功能比较齐全,界面如效果图二。有一点项目只在win10平台上测试过,其他不保证能不能运行。由于月久失更,有些依赖包可能需要修改,不过应该都是小问题,根据实际过程的报错信息修复就行。再次感谢大家的关注! 最新整理了两个版本的发布版 speech_env(效果图一) speechV2.0基于第三方接口实现语音识别和语音合成,说话人识别功能(效果图二) 微信:LHH754086474 于2019年12月25日更新。
2023-04-09 19:54:11 116.98MB 系统开源
1
深度递归神经网络在语音分离中的应用和增强 语音分离实验 培训代码: codes/TSP/train_TSP_demo_mini_clip.m 演示版 在codes/TSP/demo/model.mat找到预训练的模型 在codes/TSP/demo/run_test_single_model.m运行演示代码 依存关系 该软件包基于 该软件依赖Mark Schmidt的软件包进行凸面优化。 此外,我们还包括了用于处理MFCC文件的Mark Hasegawa-Johnson的。 我们将用于计算功能(MFCC,logmel)(HCopy)。 我们使用信号处理功能。 我们使用工具箱版本2.0、3.0进行评估。 处理您的数据: 要尝试对数据进行编码,请参阅mir1k,TSP设置-相应地将数据放入codes/TSP/Data/ 。 调整开发集上的参数并检查结果。 笔记 使用MATLAB
2023-03-18 16:58:37 52.13MB MATLAB
1
有完整的代码程序,有语音,高斯混合模型的说话人识别
2023-02-28 15:11:38 2.68MB matlab
1
基于高斯混合模型的说话人识别matlab代码实现
2022-11-30 12:28:51 2.68MB matlab 说话人识别
说话人识别CNN声纹识别
2022-10-28 16:42:53 5.95MB SR
1
VoxCeleb教练 该存储库包含用于培训演讲者识别模型的框架,该文章在“捍卫说话者识别的度量学习”一文中进行了描述。 依存关系 pip install -r requirements.txt 资料准备 以下脚本可用于下载和准备VoxCeleb数据集以进行培训。 python ./dataprep.py --save_path data --download --user USERNAME --password PASSWORD python ./dataprep.py --save_path data --extract python ./dataprep.py --save_path data --convert 为了使用数据扩充,还运行: python ./dataprep.py --save_path data --augment 除Python依赖项外,必须在系统上安装wg
1
应用背景语音识别是当今生活中的一个热门话题。语音识别的应用可以随处可见,这使我们的生活更为有效。例如在手机上的应用,而不是打电话的人的名字,人们可以直接说出姓名的人到手机,和手机会自动呼叫那个人。如果人们想给别人发短信,人们也可以把短信发到手机上,而不是打字。语音识别是一种人们可以用自己的语言来控制系统的技术。代替键盘或操作系统的按钮,使用语音来控制系统更方便。同时也可以降低工业生产的成本。使用语音识别系统不仅提高了日常生活的效率,而且使人们的生活更加多样化关键技术总的来说,这个项目的目的是探讨通过编程与仿真设计的系统是基于matlab的语音识别算法。同时,该项目的另一个目的是利用所学到的知识的实际应用。在这个项目中,我们将计划2个系统。这两个设计系统的主要算法是相关和Mel频率倒谱系数。为了得到可靠的结果,测试将在不同的情况下完成。首先,测试环境将噪声和无噪声分别为研究设计系统的噪声免疫力。测试的话,将选择不同的对,是容易3 | P A G E公认的单词和难识别的单词。由于设计的系统需要三个输入语音的话,这是2个参考语音和一个目标语音的话,所以这是显着的检查,如果两者的设计系统工作时
2022-07-13 11:07:25 678KB MFCC 说话人识别系统
深度学习框架下说话人识别综述
2022-06-14 19:08:57 823KB 声纹识别
1
Auto Speaker Recognition main.py the main file for test audio_record.py record audio from micro phone count_days.py count days between two date. 20110805 20160903 mfcc_feature.py extract mfcc feature from wav files SGD.model* the trained model on train set , and the accurate is 70% util.py contains the most useful functions train train data is 75% of all the data test test data is 25% of all the data and has no overlap with train set classification_SGD.py is the main classification function py file , and it use
2022-06-14 12:48:51 9.44MB 说话人识别
1