speechbrain.lobes.models.MetricGAN 模块

MetricGAN 中使用的生成器和判别器

作者:* Szu-Wei Fu 2020

摘要

EnhancementGenerator

用于增强的简单 LSTM,带有自定义初始化。

Learnable_sigmoid

一个可学习 sigmoid 的实现。

MetricDiscriminator

用于增强训练的度量估计器。

函数

shifted_sigmoid

计算移位 sigmoid。

xavier_init_layer

创建一个带有谱范数、xavier 均匀初始化和零偏置的层

参考

speechbrain.lobes.models.MetricGAN.xavier_init_layer(in_size, out_size=None, spec_norm=True, layer_type=<class 'torch.nn.modules.linear.Linear'>, **kwargs)[源代码]

创建一个带有谱范数、xavier 均匀初始化和零偏置的层

speechbrain.lobes.models.MetricGAN.shifted_sigmoid(x)[源代码]

计算移位 sigmoid。

class speechbrain.lobes.models.MetricGAN.Learnable_sigmoid(in_features=257)[源代码]

基类:Module

一个可学习 sigmoid 的实现。

参数:

in_features (int) – 输入维度

forward(x)[源代码]

处理输入张量 x 并返回输出张量。

class speechbrain.lobes.models.MetricGAN.EnhancementGenerator(input_size=257, hidden_size=200, num_layers=2, dropout=0)[源代码]

基类:Module

用于增强的简单 LSTM,带有自定义初始化。

参数:
  • input_size (int) – 输入张量的最后一个维度大小。

  • hidden_size (int) – 在 LSTM 层中使用的神经元数量。

  • num_layers (int) – 在 LSTM 中使用的层数。

  • dropout (int) – 训练期间丢弃的神经元比例。

blstm

对循环层使用正交初始化,对输入层使用 xavier 均匀初始化,偏置为 0

forward(x, lengths)[源代码]

处理输入张量 x 并返回输出张量。

class speechbrain.lobes.models.MetricGAN.MetricDiscriminator(kernel_size=(5, 5), base_channels=15, activation=<class 'torch.nn.modules.activation.LeakyReLU'>)[源代码]

基类:Module

用于增强训练的度量估计器。

包含
  • 四个 2D 卷积层

  • 通道平均

  • 三个全连接层

参数:
  • kernel_size (tuple) – 用于卷积的二维核的维度。

  • base_channels (int) – 每个卷积层中使用的通道数量。

  • activation (Callable) – 层之间应用的函数。

forward(x)[源代码]

处理输入张量 x 并返回输出张量。