Python get_dict_file Beispiele

Programmiersprache: Python

Namespace / Paketname: MicroTokenizer

Methode / Funktion: get_dict_file

Beispiele auf hotexamples.com: 3

Python get_dict_file - 3 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die MicroTokenizer.get_dict_file, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Beispiel #1

Datei anzeigen

    def load(cls, model_dir: str):
        dict_file = get_dict_file(model_dir)
        token_dict = DictionaryData.read_dict(dict_file)

        return cls(token_dict)

Beispiel #2

Datei anzeigen

Datei: base_dictionary_based_tokenizer.py Projekt: lanSeFangZhou/MicroTokenizer

 def load_model(self):
     self.dict_file = get_dict_file(self.model_dir)

Beispiel #3

Datei anzeigen

Datei: hash_table_algorithm.py Projekt: yyxt11/MicroTokenizer

class HashTableAlgorithm(DictionaryData):
    def __init__(self, dict_file):
        super(HashTableAlgorithm, self).__init__(dict_file)

    def get_token_and_weight_at_text_head(self, text):
        for token, weight in self.dict_data.items():
            if text.startswith(token):
                yield token, weight

    def add_token_and_weight(self, token, weight):
        if token in self.dict_data:
            raise ValueError("token: {} already in dict_data".format(token))

        self.dict_data[token] = weight


if __name__ == "__main__":
    from timer_cm import Timer

    from MicroTokenizer import default_model_dir, get_dict_file

    dictionary_object = HashTableAlgorithm(get_dict_file(default_model_dir))

    with Timer('Building DAG graph'):
        for _ in range(100):
            result = list(
                dictionary_object.get_token_and_weight_at_text_head("王小明在北京的清华大学读书。")
            )

    print(result)