SpeechBrain 高级
🔗 性能分析
Nautsch A. |
2022 年 6 月 |
难度:中等 |
时间:45 分钟 |
SpeechBrain 模型性能分析和基准测试可以服务于不同的目的,并从不同的角度进行。性能要求高度依赖于使用 SpeechBrain 的特定用例。这为全面的自学提供了手段,作为超出所提供内容的个人成长的起点。
🔗 动态批处理:它是什么以及为什么有时需要它
Nautsch A. 和 Cornell S. |
2021 年 11 月 |
难度:中等 |
时间:25 分钟 |
您想加速训练或减少内存需求吗?动态批处理可能是一个解决方案。通过这种方法,您可以动态地采样由可变数量的句子组成的批次。在本教程中,我们将展示如何在 SpeechBrain 中使用这项技术。
🔗 超参数优化
Ploujnikov A. |
2021 年 12 月 |
难度:中等 |
时间:25 分钟 |
您想优化模型的超参数吗?您是否厌倦了手动调整?本教程将介绍如何使用 Orion 工具包优化 SpeechBrain 模型的超参数。
🔗 通过 SpeechBrain 和 Flower 进行联邦语音模型训练
Gao Y. & Parcollet T. |
2021 年 11 月 |
难度:高 |
时间:45 分钟 |
您对联邦学习 (FL) 和语音处理都感兴趣,但又担心缺乏合适的工具来运行实验?今天您将找到答案。本教程将介绍如何集成 Flower 和 SpeechBrain 来实现联邦语音模型训练。
🔗 在训练好的 SpeechBrain 模型上进行推理
Parcollet T. |
2021 年 9 月 |
难度:中等 |
时间:30 分钟 |
在本教程中,我们将学习在训练好的模型上进行推理的三种不同方法。这对于调试您的管道或在生产环境中部署模型特别有用。
🔗 使用 HuggingFace 的预训练模型和微调
Cornell S. & Parcollet T. |
2021 年 3 月 |
难度:中等 |
时间:30 分钟 |
训练 DNN 模型通常非常耗时且昂贵。因此,在可能的情况下,使用现成的预训练模型在各种场景中都非常方便。我们提供了一种简单直接的方法来从 HuggingFace 下载和实例化最先进的预训练模型,并将其用于直接推理、微调/知识蒸馏或您能想到的任何新颖技术!
🔗 大型数据集和共享文件系统的数据加载
Rouhe A. |
2021 年 2 月 |
难度:中等 |
时间:15 分钟 |
您是否有一个存储在共享文件系统中的庞大数据集?本教程将向您展示如何从共享文件系统加载大型数据集,并使用它们通过 SpeechBrain 训练神经网络。特别是,我们描述了一种基于 WebDataset 库的解决方案,该方案易于集成到 SpeechBrain 工具包中。
🔗 文本分词
Heba A. & Parcollet T. |
2021 年 2 月 |
难度:简单 |
时间:20 分钟 |
处理文本的机器学习任务可能包含数千个词汇词,这导致模型需要处理庞大的嵌入作为输入/输出(例如,对于 One-Hot 向量和 ndim=词汇量大小)。这会导致大量的内存消耗、复杂的计算,更重要的是,由于极其稀疏和繁琐的 One-Hot 向量,学习效果不佳。在本教程中,我们提供了正确使用依赖于 SentencePiece(BPE 和 unigram)的 SpeechBrain 分词器所需的所有基础知识。
🔗 将量化应用于语音识别模型
Lam J. |
2024 年 4 月 |
难度:中等 |
时间:30 分钟 |
量化是许多深度神经网络的必要步骤,特别是对于需要低延迟和高效内存使用的任务,例如实时自动语音识别。本教程将介绍量化的问题,并解释如何使用 SpeechBrain 执行量化。