speechbrain.lobes.models.MetricGAN 模块

MetricGAN 中使用的生成器和判别器

作者：* Szu-Wei Fu 2020

摘要

类

`EnhancementGenerator`	用于增强的简单 LSTM，带有自定义初始化。
`Learnable_sigmoid`	一个可学习 sigmoid 的实现。
`MetricDiscriminator`	用于增强训练的度量估计器。

函数

`shifted_sigmoid`	计算移位 sigmoid。
`xavier_init_layer`	创建一个带有谱范数、xavier 均匀初始化和零偏置的层

参考

speechbrain.lobes.models.MetricGAN.xavier_init_layer(in_size, out_size=None, spec_norm=True, layer_type=<class 'torch.nn.modules.linear.Linear'>, **kwargs)[源代码]: 创建一个带有谱范数、xavier 均匀初始化和零偏置的层

speechbrain.lobes.models.MetricGAN.shifted_sigmoid(x)[源代码]: 计算移位 sigmoid。

class speechbrain.lobes.models.MetricGAN.Learnable_sigmoid(in_features=257)[源代码]

基类：Module

一个可学习 sigmoid 的实现。

参数:: in_features (int) – 输入维度

forward(x)[源代码]: 处理输入张量 x 并返回输出张量。

class speechbrain.lobes.models.MetricGAN.EnhancementGenerator(input_size=257, hidden_size=200, num_layers=2, dropout=0)[源代码]

基类：Module

用于增强的简单 LSTM，带有自定义初始化。

参数:

input_size (int) – 输入张量的最后一个维度大小。
hidden_size (int) – 在 LSTM 层中使用的神经元数量。
num_layers (int) – 在 LSTM 中使用的层数。
dropout (int) – 训练期间丢弃的神经元比例。

blstm: 对循环层使用正交初始化，对输入层使用 xavier 均匀初始化，偏置为 0

forward(x, lengths)[源代码]: 处理输入张量 x 并返回输出张量。

class speechbrain.lobes.models.MetricGAN.MetricDiscriminator(kernel_size=(5, 5), base_channels=15, activation=<class 'torch.nn.modules.activation.LeakyReLU'>)[源代码]

基类：Module

用于增强训练的度量估计器。

包含

四个 2D 卷积层
通道平均
三个全连接层

参数:

kernel_size (tuple) – 用于卷积的二维核的维度。
base_channels (int) – 每个卷积层中使用的通道数量。
activation (Callable) – 层之间应用的函数。

forward(x)[源代码]: 处理输入张量 x 并返回输出张量。