Esempi in Python per GPT2Tokenizer.tokenize

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: transformers

Classe/tipologia: GPT2Tokenizer

Metodo/funzione: tokenize

Esempi su hotexamples.com: 2

GPT2Tokenizer.tokenize in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per transformers.GPT2Tokenizer.tokenize, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

from_pretrained(30)

GPT2Tokenizer(22)

decode(6)

encode(5)

tokenize(2)

convert_tokens_to_ids(1)

from_pretrianed(1)

save_pretrained(1)

Esempio n. 1

Mostra file

File: utils.py Progetto: Ledenel/csnet-data-mining

def tokenized_index(tokenizer: GPT2Tokenizer, text):
    token_list = tokenizer.tokenize(text)
    text_bytes = [
        bytes([tokenizer.byte_decoder[c] for c in text]) for text in token_list
    ]
    token_indexes = list(itertools.accumulate(map(len, text_bytes)))
    return token_indexes

Esempio n. 2

Mostra file

File: preprocessor.py Progetto: contemn1/unsupervised_summerization

def tokenize_list(content_list: List[str], tokenizer: GPT2Tokenizer):
    return [tokenizer.tokenize(sentence) for sentence in content_list]