speechbrain.augment.preparation 模块

用于下载和准备用于数据增强的数据集的库。该库提供了从网络下载数据集并准备必要 CSV 数据清单文件以供数据增强器使用的函数。

作者: * Mirco Ravanelli 2023

概要

函数

prepare_csv

遍历一组 wav 文件并写入相应的 csv 文件。

prepare_dataset_from_URL

从提供的 URL 下载包含录音(例如,噪声序列)的数据集,并准备必要的 CSV 文件供噪声增强器使用。

write_csv

遍历音频文件列表并写入相应的 CSV 文件。

参考

speechbrain.augment.preparation.prepare_dataset_from_URL(URL, dest_folder, ext, csv_file, max_length=None)[源代码]

从提供的 URL 下载包含录音(例如,噪声序列)的数据集,并准备必要的 CSV 文件供噪声增强器使用。

参数:
  • URL (str) – 要下载的数据集的 URL。

  • dest_folder (str) – 噪声数据集下载到的本地文件夹。

  • ext (str) – 在下载的数据集中搜索的文件扩展名。

  • csv_file (str) – 存储准备好的噪声 CSV 文件的路径。

  • max_length (float) – 最大长度(秒)。长度超过此值的录音将自动切片。

speechbrain.augment.preparation.prepare_csv(filelist, csv_file, max_length=None)[源代码]

遍历一组 wav 文件并写入相应的 csv 文件。

参数:
  • filelist (str) – 包含感兴趣文件路径的列表。

  • csv_file (str) – 存储准备好的噪声 CSV 文件的路径。

  • max_length (float) – 最大长度(秒)。长度超过此值的录音将自动切片。

speechbrain.augment.preparation.write_csv(filelist, csv_file, max_length=None)[源代码]

遍历音频文件列表并写入相应的 CSV 文件。

参数:
  • filelist (list of str) – 包含感兴趣音频文件路径的列表。

  • csv_file (str) – 存储准备好的噪声 CSV 文件的路径。

  • max_length (float (可选)) – 最大录音长度(秒)。长度超过此值的录音将自动切片。