Exemplos de Vocabulary.build em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: data

Classe / Tipo: Vocabulary

Método / Função: build

Exemplos em hotexamples.com: 3

Vocabulary.build em Python - 3 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de data.Vocabulary.build em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Vocabulary(30)

load(6)

build(3)

encode(2)

from_file(1)

get_char(1)

index_sentences(1)

lookup_idx(1)

numCharacters(1)

save(1)

save_word_indexes(1)

token_to_id(1)

tokenize(1)

Métodos Frequentes

Vocabulary (30)

load (6)

build (3)

encode (2)

from_file (1)

get_char (1)

index_sentences (1)

lookup_idx (1)

numCharacters (1)

save (1)

Métodos Frequentes

save_word_indexes (1)

token_to_id (1)

tokenize (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: prepare_vocab.py Projeto: yasufumy/keras_qanet

def main(args): spacy_en = spacy.load('en_core_web_sm', disable=['vectors', 'textcat', 'tagger', 'parser', 'ner']) postprocess = str.lower if args.lower else lambda x: x def tokenizer(x): return [postprocess(token.text) for token in spacy_en(x) if not token.is_space] if args.only_question: indices = [1] desc = 'question' elif args.only_context: indices = [0] desc = 'context' else: indices = [0, 1] desc = 'question_context' basename, ext = os.path.splitext(args.vocab_path) min_freq = args.min_freq if args.min_freq else '' max_size = args.max_size if args.max_size else '' filename = f'{basename}_{desc}_min-freq{min_freq}_max_size{max_size}{ext}' squad_tokens = load_squad_tokens(args.train_path, tokenizer, indices=indices) Vocabulary.build(squad_tokens, args.min_freq, args.max_size, (PAD_TOKEN, UNK_TOKEN), filename)

Exemplo n.º 2

0

Exibir arquivo

def main(args): tokenizer = get_tokenizer(lower=args.lower, as_str=True) if args.only_question: indices = [1] desc = 'question' elif args.only_context: indices = [0] desc = 'context' else: indices = [0, 1] desc = 'question_context' basename, ext = os.path.splitext(args.vocab_path) min_freq = args.min_freq if args.min_freq else '' max_size = args.max_size if args.max_size else '' filename = f'{basename}_{desc}_min-freq{min_freq}_max_size{max_size}{ext}' squad_tokens = load_squad_tokens(args.train_path, tokenizer, indices=indices) Vocabulary.build(squad_tokens, args.min_freq, args.max_size, (PAD_TOKEN, UNK_TOKEN), filename)

Exemplo n.º 3

0

Exibir arquivo

Arquivo: test_data.py Projeto: yasufumy/keras_qanet

def test_build(self): tokens = ['rock', 'n', 'roll'] token_to_index, index_to_token = Vocabulary.build( tokens, 1, 4, ('<pad>', ), None) tokens += ['<pad>'] self.assertCountEqual(token_to_index.keys(), tokens)