代码拉取完成,页面将自动刷新
同步操作将从 PaddlePaddle/DeepSpeech 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
(简体中文|English)
语音翻译是将会话口语短语翻译成另一语言的过程。
该 Demo 是从特定音频文件中识别文本并将其翻译为目标语言的实现。它可以通过使用 PaddleSpeech
的单个命令或 python 中的几行代码来实现。
pip install paddlespeech
这个 Demo 的输入是 WAV(.wav
) 语音文件
这里给出一些样例文件供 Demo 使用:
wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
命令行(推荐使用)
paddlespeech st --input ./en.wav
使用方法:
paddlespeech st --help
参数:
input
(必须输入):用于翻译的音频。model
: 语音翻译的模型类型. 默认:fat_st_ted
。src_lang
: 源语言. 默认:en
。tgt_lang
: 目标语言. 默认:zh
。sample_rate
:输入音频的采样率. 默认:16000
。config
:语音翻译任务的配置文件. 如果没有默认使用预训练模型的配置文件. 默认:None
。ckpt_path
:模型文件. 如果没有默认使用预训练模型. 默认:None
。device
:选择执行的设备. 默认: 当前环境 paddlepaddle 的默认设备。输出:
[2021-12-09 11:13:03,178] [ INFO] [utils.py] [L225] - ST Result: ['我 在 这栋 建筑 的 古老 门上 敲门 。']
Python API
import paddle
from paddlespeech.cli import STExecutor
st_executor = STExecutor()
text = st_executor(
model='fat_st_ted',
src_lang='en',
tgt_lang='zh',
sample_rate=16000,
config=None, # Set `config` and `ckpt_path` to None to use pretrained model.
ckpt_path=None,
audio_file='./en.wav',
device=paddle.get_device())
print('ST Result: \n{}'.format(text))
输出:
ST Result:
['我 在 这栋 建筑 的 古老 门上 敲门 。']
以下是 PaddleSpeech 提供的可以被命令行和 python API 使用的预训练模型列表:
模型 | 源语言 | 目标语言 |
---|---|---|
fat_st_ted | en | zh |
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。