speechbrain.nnet.loss.stoi_loss 模块
用于计算 STOI 的库。参考文献:“End-to-End Waveform Utterance Enhancement for Direct Evaluation Metrics Optimization by Fully Convolutional Neural Networks”,TASLP,2018
- 作者
Szu-Wei, Fu 2020
摘要
函数
从 STOI 计算中移除静音帧。 |
|
计算 STOI 分数并返回 -1 * 该分数。 |
|
返回 1/3 倍频带矩阵。 |
参考
- speechbrain.nnet.loss.stoi_loss.removeSilentFrames(x, y, dyn_range=40, N=256, K=128)[source]
从 STOI 计算中移除静音帧。
此函数可用作基于 SGD 更新的训练的损失函数。
- speechbrain.nnet.loss.stoi_loss.stoi_loss(y_pred_batch, y_true_batch, lens, reduction='mean')[source]
计算 STOI 分数并返回 -1 * 该分数。
此函数可用作基于 SGD 更新的训练的损失函数。
- 参数:
y_pred_batch (torch.Tensor) – 退化的 (增强的) 波形。
y_true_batch (torch.Tensor) – 干净的 (参考) 波形。
lens (torch.Tensor) – 批次内波形的相对长度。
reduction (str) – 要使用的归约类型 (“mean” 或 “batch”)。
- 返回类型:
计算出的 STOI 损失。
示例
>>> a = torch.sin(torch.arange(16000, dtype=torch.float32)).unsqueeze(0) >>> b = a + 0.001 >>> -stoi_loss(b, a, torch.ones(1)) tensor(0.7...)