speechbrain.utils

包含各种工具 (准确率, 检查点等) 的包

speechbrain.utils.Accuracy

计算准确率。

speechbrain.utils.DER

使用 NIST RT Evaluation 的 md-eval-22.pl 计算分割错误率 (DER),它是漏检说话人 (MS)、虚警 (FA) 和说话人错误率 (SER) 的总和。

speechbrain.utils.EDER

计算情感分割错误率 (EDER),它是漏检情感 (ME)、虚警 (FA) 和混淆 (CF) 的总和。

speechbrain.utils.autocast

此模块实现与 torch.autocast (即自动混合精度) 一起使用的工具和抽象。

speechbrain.utils.bertscore

提供 BERTscore 评估指标的指标类。

speechbrain.utils.bleu

此文件确保旧的指向 bleu 的链接继续有效,同时提供弃用警告

speechbrain.utils.callchains

链式调用可调用对象,如果某些对象需要相对长度

speechbrain.utils.checkpoints

此模块实现检查点保存器和加载器。

speechbrain.utils.data_pipeline

用于数据转换的管线。

speechbrain.utils.data_utils

此库收集用于数据输入输出操作的工具。

speechbrain.utils.depgraph

用于查找评估顺序的依赖图。

speechbrain.utils.dictionaries

字典工具,例如同义词字典。

speechbrain.utils.distances

距离指标和相关函数

speechbrain.utils.distributed

用于仅在主进程上运行某些操作的守卫

speechbrain.utils.dynamic_chunk_training

动态分块训练 (Dynamic Chunk Training) 的配置和工具类,常用于训练语音识别中的流式模型。

speechbrain.utils.edit_distance

编辑距离和 WER 计算。

speechbrain.utils.epoch_loop

实现一个可检查点的 epoch 计数器 (循环),可选择集成早停。

speechbrain.utils.fetching

下载或以其他方式获取预训练模型

speechbrain.utils.filter_analysis

实现建模和组合滤波器属性的工具,即计算窗口大小、步长等如何影响结果。

speechbrain.utils.hparams

hparams 文件工具

speechbrain.utils.hpopt

超参数优化工具。

speechbrain.utils.importutils

模块导入相关工具。

speechbrain.utils.kmeans

训练 kmeans 模型工具。

speechbrain.utils.logger

日志管理工具

speechbrain.utils.metric_stats

metric_stats 模块提供一个抽象类,用于存储实验过程中产生的统计数据并进行汇总。

speechbrain.utils.optimizers

实现避免优化某些参数的函数

speechbrain.utils.parallel

并行处理工具,有助于加速数据预处理等任务。

speechbrain.utils.parameter_transfer

最简单参数迁移情况的便捷函数。

speechbrain.utils.pretrained

预训练模型训练工具

speechbrain.utils.profiling

处理 PyTorch 性能分析和基准测试的包装器。

speechbrain.utils.quirks

全局更改和平台/GPU 特定怪异行为,即变通方法和更合理的默认值,有时是由于平台特定问题。

speechbrain.utils.seed

可复现性种子工具。

speechbrain.utils.semdist

提供 SemDist 评估指标的指标类。

speechbrain.utils.streaming

辅助设计和训练流式模型的工具。

speechbrain.utils.superpowers

应谨慎使用的“超能力”工具。

speechbrain.utils.text_to_sequence

来自 https://github.com/keithito/tacotron

speechbrain.utils.torch_audio_backend

用于检查 torchaudio 后端的库。

speechbrain.utils.train_logger

用于实验监控的日志记录器。