speechbrain.utils.dictionaries 模块

字典实用工具,例如同义词典。

作者
  • Sylvain de Langen 2024

总结

SynonymDictionary

加载同义词集,并允许您查询两个词是否是同义词。

参考

class speechbrain.utils.dictionaries.SynonymDictionary[源代码]

基类: object

加载同义词集,并允许您查询两个词是否是同义词。

例如,当标准化不适合时,这可用于检查同一单词的两种拼写是否相等。

同义词不被视为传递关系:如果 A 是 B 的同义词,B 是 C 的同义词,除非它们被添加到同一个同义词集中,否则 A 不被视为 C 的同义词。

static from_json_file(file) SynonymDictionary[源代码]

将一个已打开的文件解析为 JSON,其中顶层结构是一个同义词集列表(即彼此都是同义词的单词),例如 [ ["hello", "hi"], ["say", "speak", "talk"] ]

参数:

file (文件对象) – 支持读取的文件对象(例如,一个 open 打开的文件)

返回:

从解析的 JSON 文件创建的同义词典,已添加所有同义词集。

返回类型:

SynonymDictionary

static from_json_path(path) SynonymDictionary[源代码]

打开一个文件并将其解析为 JSON,语义与使用已打开文件的 from_json_file() 相同。

参数:

path (字符串) – JSON 文件路径

返回:

从解析的 JSON 文件创建的同义词典,已添加所有同义词集。

返回类型:

SynonymDictionary

add_synonym_set(words: Iterable[str]) None[源代码]

添加一组互为同义词的单词。

参数:

words (可迭代对象[字符串]) – 应定义为互为同义词的单词列表

__call__(a: str, b: str) bool[源代码]

检查两个词的相等性或同义词相等性。

参数:
  • a (字符串) – 第一个要比较的词。可能不在已知字典中。

  • b (字符串) – 第二个要比较的词。可能不在已知字典中。参数顺序无关紧要。

返回:

a 和 b 是否应被视为同义词。不同传递关系,请参见主类文档。

返回类型:

布尔值

get_synonyms_for(word: str) set[源代码]

返回给定词的同义词集。

参数:

word (字符串) – 要查找同义词的词。可能不在已知字典中。

返回:

此词的已知同义词集。请勿修改(或提前复制)。如果该词没有已知同义词,则可能为空集。

返回类型:

字符串集合