Python Vocab.getVocabOffset Exemples

Langage de programmation: Python

Espace de nommage/Pack: models.Vocab

Class/Type: Vocab

Méthode/Fonction: getVocabOffset

Exemples au hotexamples.com: 3

Python Vocab.getVocabOffset - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de models.Vocab.Vocab.getVocabOffset extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Vocab(8)

getSize(6)

getTokenString(3)

getVocabOffset(3)

getMaskToken(2)

getClassLabelToken(1)

getToken(1)

getTokenBytes(1)

getUnkToken(1)

isReservedToken(1)

Méthodes fréquemment utilisées

Vocab (8)

getSize (6)

getTokenString (3)

getVocabOffset (3)

getMaskToken (2)

getClassLabelToken (1)

getToken (1)

getTokenBytes (1)

getUnkToken (1)

isReservedToken (1)

Exemple #1

0

Afficher le fichier

def saveVocab(dataset, size, directory): import os import time vocab = createInitialVocab() if os.path.isdir(directory): outputPath = os.path.join(directory, "vocab.txt") if not os.path.exists(directory): os.makedirs(directory) else: outputPath = directory previousVocabSize = 0 start = time.time() totalTokens = 0 while True: string = dataset.next() if len(string) == 0: break if not string in vocab: vocab[string] = 0 totalTokens += 1 vocab[string] += 1 if len(vocab) + Vocab.getVocabOffset( ) >= previousVocabSize + size * 0.01: previousVocabSize = len(vocab) + Vocab.getVocabOffset() logger.debug("Vocab size is " + str(previousVocabSize) + " time so far: " + str(time.time() - start) + " total tokens: " + str(totalTokens)) if len(vocab) + Vocab.getVocabOffset() >= size: break with open(outputPath, "w", encoding='utf-8') as outputFile: for token, count in reversed(sorted(vocab.items(), key=lambda x: x[1])): if token[-1] != '\n': token += '\n' outputFile.write(token)

Exemple #2

0

Afficher le fichier

def maskOffTokens(self, labels): inputs = list(labels) for i in range(1, len(labels)): if self.random.binomial(1, 0.15): if self.random.binomial(1, 0.8): inputs[i] = Vocab.getMaskToken() else: if self.random.binomial(1, 0.5): inputs[i] = self.random.randint(Vocab.getVocabOffset(), self.vocab.getSize()) inputs[0] = Vocab.getClassLabelToken() return inputs

Exemple #3

0

Afficher le fichier

Fichier : FallbackTokenEvaluator.py Projet : sudnya/bert-word-embeddings

def isPredictedToken(self, token): return token == Vocab.getMaskToken() or token == Vocab.getVocabOffset()