SpeechBrain 基础

在 SpeechBrain 中，我们决定超参数和学习算法之间的区别应该在工具包的结构中明确体现，因此我们将 recipe 分为两个主要文件：train.py 和 hyperparams.yaml。 hyperparams.yaml 文件采用 SpeechBrain 开发的格式，我们称之为“HyperPyYAML”。我们选择扩展 YAML，因为它是一种高度可读的数据序列化格式。通过扩展这种已经非常有用的格式，我们能够创建一个扩展的超参数定义，同时保持我们的实际实验代码精简且高度可读。

🔗 数据加载

Cornell S. & Rouhe A.

2021年1月

难度：中等

时间：20分钟

🔗 Google Colab

设置高效的数据加载流程通常是一项繁琐的任务，涉及创建示例、定义你的 torch.utils.data.Dataset 类以及不同的数据采样和增强策略。在 SpeechBrain 中，我们提供了高效的抽象来简化这个耗时的过程，同时不牺牲灵活性。事实上，我们的数据流程是围绕 PyTorch 构建的。

🔗 检查点

Rouhe A.

2021年2月

难度：简单

时间：15分钟

🔗 Google Colab

检查点是指在特定时间点保存模型和所有其他必要的状态信息（例如优化器参数、当前 epoch 和迭代次数）。