调用百度语音识别API,Python SDK。并评估WER词错误率
2024-04-16 16:49:31 38.14MB 语音识别 python
1
易语言做精准识别语音,通过百度语音识别API实现精准识别。代码有大量标注易看易懂。
2024-02-16 09:26:42 621KB 语音识别
1
百度语音播报合成工具,可以无限制使用,长度也不限制,直接翻译成MP3格式,使用很方便
1
百度语音识别sdk的使用demo.应该可以节省大家一些使用时间。
2023-12-13 14:30:36 174KB 语音识别 百度AI
1
本人整理的百度语音识别接口,包括语音识别成文字、语音转换等功能
2023-12-13 14:03:51 6KB 语音识别
1
1.项目基于机器学习和语义识别技术,让机器人理解文本并进行合适的答复。通过使用语音与其交流,实现智能问答、智能音箱及智能机器宠物。 2.项目运行环境:包括 Python 环境、ChatterBot 环境。 Python 3.6 及以上配置。基于 chatterbot 0.8.7 开发,打开 cmd 进入 python 所在的磁盘,输入:pip install –ignore-installed –upgrade chatterbot0.8.7 等待安装即可。 3.项目包括 6 个模块:模型构建、服务器端、客户端、语音录入、接口调用、模型训练及保存。需进入百度云官网:https://ai.baidu.com/,进入我的控制台,打开百度语音进入语音应用管理界面,创建一个新的应用,并记录 APPID、API Key 和 Secret Key 三个值;聊天窗口的 GUI 界面,包括当前用户显示、信息输入框、语音输入按钮、发送和关闭按钮等各种控件并绑定发送消息、输入消息等事件。模型训练这块,可以直接使用项目中训练的模型,也可以根据自己需求替换成其他模型,如使用ChatGPT等通用大语言模型
2023-12-07 10:25:46 14KB python 机器学习 深度学习 语音识别
1
:是对AIUI的语音SDK封装,套餐费用最低在6万/年 :是对原始msc的语音SDK封装,相对AIUI便宜很多 :是对百度语音SDK封装,百度号称永久免费 :AIUI网络测试工具-折线图动态测试可持续观测 共同特点:实现了全双工语音识别iat、合成tts、和语义nlp部分接口的封装,经过稳定测试,通过简洁的调用方式来满足开发需求。两者核心类都是 SpeechManager 参考文档:、 参考项目: 全双工语音识别库 重大亮点:全双工语音识别,不中断,不中断,不中断 ChatSDK 是基于讯飞的AIUI进行封装,使用简洁,您可以下载本项目,然后将作为 Module 导入你的项目使用 功能包括:语音识别、语音合成、语音语义理解、文本语义理解 场景:(语音点读笔、AI机器人、智能音箱、车载语音、家电语音、人机交互、在线教育机器人、语音鼠标、实时翻译、大屏广告互动、...) 落地产品公司:
2023-03-21 07:44:16 47.44MB Java
1
最近在处理语音检索相关的事。 其中用到语音识别,调用的是讯飞与百度的api,前者使用js是实现,后者用python3实现(因为自己使用python) 环境: python3.5 centos 7 流程 整个百度语音识别rest api 使用分为三部分: 1 (申请操作)创建应用,获取应用的 API Key 以及 Secret Key。 2 (程序实现)通过已知的 应用的 API Key 以及 Secret Key, 发送post 请求到 https://openapi.baidu.com/oauth/2.0/token 获取 token 3 (程序实现) 通过上步骤获取的 toke
2023-03-17 10:06:58 79KB api python token
1
从视频中提取音频 安装 moviepy pip install moviepy 相关代码: audio_file = work_path + '\\out.wav' video = VideoFileClip(video_file) video.audio.write_audiofile(audio_file,ffmpeg_params=['-ar','16000','-ac','1']) 根据静音对音频分段 使用音频库 pydub,安装: pip install pydub 第一种方法: # 这里silence_thresh是认定小于-70dBFS以下的为silence,发现小于 s
2023-02-25 15:11:37 96KB 百度 语音识别
1
在Linux环境下,C语言编写服务器,完成的功能是利用v4l2技术采集usb摄像头视频,传输到Qt客户端显示。其中还有百度语音识别的动能。
2023-02-06 14:52:51 597KB v4l2 tuling 语音识别
1