Easy-to-use Speech Toolkit including SOTA ASR pipeline, influential TTS with text frontend and End-to-End Speech Simultaneous Translation.
🎤 微软语音合成工具,使用 Electron + Vue + ElementPlus + Vite 构建,将文字转为语音MP3。
基于websocket实现浏览器端文本、视频、语音的即时通讯,以及实时语音转文字
迅飞 语音听写 WebAPI - 把语音(≤60秒)转换成对应的文字信息,让机器能够“听懂”人类语言,相当于给机器安装上“耳朵”,使其具备“能听”的功能
DeepSpeech2是一个采用PaddlePaddle平台的端到端自动语音识别(ASR)引擎的开源项目