Python BPEmb.encode_with_bos_eos Exemples

Langage de programmation: Python

Espace de nommage/Pack: bpemb

Class/Type: BPEmb

Méthode/Fonction: encode_with_bos_eos

Exemples au hotexamples.com: 2

Python BPEmb.encode_with_bos_eos - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de bpemb.BPEmb.encode_with_bos_eos extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

BPEmb(30)

encode_ids(27)

encode(21)

decode_ids(9)

embed(9)

encode_ids_with_bos_eos(8)

decode(2)

encode_ids_with_eos(2)

encode_with_bos_eos(2)

pad_token_id(2)

available_vocab_sizes(1)

encode_with_eos(1)

most_similar(1)

Méthodes fréquemment utilisées

BPEmb (30)

encode_ids (27)

encode (21)

decode_ids (9)

embed (9)

encode_ids_with_bos_eos (8)

decode (2)

encode_ids_with_eos (2)

encode_with_bos_eos (2)

pad_token_id (2)

Méthodes fréquemment utilisées

available_vocab_sizes (1)

encode_with_eos (1)

most_similar (1)

Exemple #1

0

Afficher le fichier

Fichier : TestBPE.py Projet : erelcan/keras-transformer

def test_encoding(): text = ["This is Stratford", "<pad>"] bpemb_en = BPEmb(lang="en", add_pad_emb=True) # We can auto-add and encode start/end tokens. However, encoder can't handle <pad> directly. # We should pad outside with the corresponding index (index of the last word when add_pad_emb True). print(bpemb_en.encode(text)) print(bpemb_en.encode_with_eos(text)) print(bpemb_en.encode_with_bos_eos(text)) print(bpemb_en.encode_ids(text)) print(bpemb_en.encode_ids_with_eos(text)) print(bpemb_en.encode_ids_with_bos_eos(text))

Exemple #2

0

Afficher le fichier

class BPETokenizer: """Use byte pair encoding to transform text""" def __init__(self, lang='ru', pretrained=True, vocab_size=100000, dim=300): self.lang = lang self.pretrained = pretrained self.bpe = BPEmb(lang=self.lang, vs=vocab_size, dim=dim, vs_fallback=True) def fit(self, text): raise NotImplementedError('fit is not supported') def transform(self, text: Union[str, List[str]], get_ids=True): if get_ids: return self.bpe.encode_ids_with_bos_eos(text) else: return self.bpe.encode_with_bos_eos(text)