Python Tokenizer.decode Beispiele

Programmiersprache: Python

Namespace / Paketname: keras_xlnet

Klasse / Typ: Tokenizer

Methode / Funktion: decode

Beispiele auf hotexamples.com: 2

Python Tokenizer.decode - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die keras_xlnet.Tokenizer.decode, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Tokenizer(13)

encode(5)

decode(2)

Häufig verwendete Methoden

Tokenizer (13)

encode (5)

decode (2)

Beispiel #1

Datei anzeigen

 def test_re_cut(self):
     current_path = os.path.dirname(os.path.abspath(__file__))
     spm_path = os.path.join(current_path, 'spiece.model')
     tokenizer = Tokenizer(spm_path)
     text = '123,456,789.00'
     ids = tokenizer.encode(text)
     self.assertEqual(text, tokenizer.decode(ids))

Beispiel #2

Datei anzeigen

 def test_tokenizer(self):
     current_path = os.path.dirname(os.path.abspath(__file__))
     spm_path = os.path.join(current_path, 'spiece.model')
     tokenizer = Tokenizer(
         spm_path,
         remove_spaces=True,
         remove_accents=True,
         cased=True,
         sample=True,
     )
     text = 'build XLNet'
     for _ in range(10):
         ids = tokenizer.encode(text)
         self.assertEqual(text, tokenizer.decode(ids))
     tokenizer = Tokenizer(
         spm_path,
         remove_spaces=False,
         remove_accents=False,
         cased=False,
         sample=False,
     )
     ids = tokenizer.encode(text)
     self.assertEqual([1266, 3512, 368, 1942], ids)
     self.assertEqual(text.lower(), tokenizer.decode(ids))