speechbrain.inference.separation 模块

指定语音分离模块的推理接口。

作者
  • Aku Rouhe 2021

  • Peter Plantinga 2021

  • Loren Lugosch 2020

  • Mirco Ravanelli 2020

  • Titouan Parcollet 2021

  • Abdel Heba 2021

  • Andreas Nautsch 2022, 2023

  • Pooneh Mousavi 2023

  • Sylvain de Langen 2023

  • Adel Moumen 2023

  • Pradnya Kandarkar 2023

总结

SepformerSeparation

一个“即用型”语音分离模型。

参考

class speechbrain.inference.separation.SepformerSeparation(modules=None, hparams=None, run_opts=None, freeze_params=True)[source]

基类: Pretrained

一个“即用型”语音分离模型。

使用 Sepformer 架构。

示例

>>> tmpdir = getfixture("tmpdir")
>>> model = SepformerSeparation.from_hparams(
...     source="speechbrain/sepformer-wsj02mix",
...     savedir=tmpdir)
>>> mix = torch.randn(1, 400)
>>> est_sources = model.separate_batch(mix)
>>> print(est_sources.shape)
torch.Size([1, 400, 2])
MODULES_NEEDED = ['encoder', 'masknet', 'decoder']
separate_batch(mix)[source]

对音频批次运行源分离。

参数:

mix (torch.Tensor) – 源的混合物。

返回:

分离的源

返回类型:

张量

separate_file(path, savedir=None)[source]

从文件中分离源。

参数:
  • path (str) – 包含源混合物的文件路径。可以是本地路径、网页 URL 或 huggingface 仓库。

  • savedir (path) – 存储 wav 信号的路径(从网络下载时)。

返回:

分离的源

返回类型:

张量

forward(mix)[source]

对输入混合物运行分离