speechbrain.lobes.models

定义神经网络模型 (CRDNN, Xvectors 等) 的包

speechbrain.lobes.models.BESTRQ

支持 BEST RQ 训练的几个组件,如原始论文所述:https://arxiv.org/pdf/2202.01855

speechbrain.lobes.models.CRDNN

卷积、循环和全连接网络的组合。

speechbrain.lobes.models.Cnn14

此文件实现了来自 https://arxiv.org/abs/1912.10211 的 CNN14 模型

speechbrain.lobes.models.ContextNet

SpeechBrain 实现的 ContextNet,来自 https://arxiv.org/pdf/2005.03191.pdf

speechbrain.lobes.models.DiffWave

用于 DIFFWAVE 的神经网络模块:《DIFFWAVE:一种用于音频合成的多功能扩散模型》

speechbrain.lobes.models.ECAPA_TDNN

一个流行的说话人识别和分割模型。

speechbrain.lobes.models.ESPnetVGG

这个 lobes 模块复制了 ESPNET v1 中首次引入的编码器

speechbrain.lobes.models.EnhanceResnet

用于语音增强的 Wide ResNet。

speechbrain.lobes.models.FastSpeech2

用于 FastSpeech 2 的神经网络模块:《FastSpeech 2: 快速高质量端到端文本到语音合成模型》 作者 * Sathvik Udupa 2022 * Pradnya Kandarkar 2023 * Yingzhi Wang 2023

speechbrain.lobes.models.HifiGAN

用于 HiFi-GAN 的神经网络模块:《HiFi-GAN: 用于高效高保真语音合成的生成对抗网络》

speechbrain.lobes.models.L2I

此文件实现了实现 Listen-to-Interpret (L2I) 解释方法所需的类和函数,来自 https://arxiv.org/abs/2202.11479v2

speechbrain.lobes.models.MSTacotron2

用于 Zero-Shot Multi-Speaker Tacotron2 端到端神经网络文本到语音 (TTS) 模型的神经网络模块

speechbrain.lobes.models.MetricGAN

MetricGAN 中使用的生成器和判别器

speechbrain.lobes.models.MetricGAN_U

MetricGAN-U 中使用的生成器和判别器

speechbrain.lobes.models.PIQ

此文件实现了通过量化实现 Posthoc 解释所需的类和函数。

speechbrain.lobes.models.RNNLM

循环语言模型的实现。

speechbrain.lobes.models.ResNet

用于说话人验证的 PreActivated ResNet

speechbrain.lobes.models.Tacotron2

用于 Tacotron2 端到端神经网络文本到语音 (TTS) 模型的神经网络模块

speechbrain.lobes.models.VanillaNN

用于简单测试的标准神经网络。

speechbrain.lobes.models.Xvector

一个流行的说话人识别和分割模型。

speechbrain.lobes.models.beats

此 lobes 模块支持集成预训练的 BEATs:《使用声学分词器的音频预训练》

speechbrain.lobes.models.conv_tasnet

一个流行的语音分离模型的实现。

speechbrain.lobes.models.convolution

这是一个模块,用于组合带或不带残差连接的卷积(深度可分离)编码器。

speechbrain.lobes.models.dual_path

支持双路径语音分离的库。

speechbrain.lobes.models.fairseq_wav2vec

此 lobes 模块支持集成 fairseq 预训练的 wav2vec 模型。

speechbrain.lobes.models.kmeans

此文件确保指向 kmeans 的旧链接仍然有效,同时提供弃用警告

speechbrain.lobes.models.resepformer

用于 Resource-Efficient Sepformer 的库。

speechbrain.lobes.models.segan_model

此文件包含两个 PyTorch 模块,它们共同构成了 SEGAN 模型架构(基于论文:Pascual 等人,https://arxiv.org/pdf/1703.09452.pdf)。

speechbrain.lobes.models.wav2vec

构建遵循原始论文 https://arxiv.org/abs/2006.11477 的 wav2vec 2.0 架构所需的组件。

speechbrain.lobes.models.discrete

高级处理块。

speechbrain.lobes.models.g2p

speechbrain.lobes.models.transformer

高级处理块。