Python Transformer.load Exemples

Langage de programmation: Python

Espace de nommage/Pack: model

Class/Type: Transformer

Méthode/Fonction: load

Exemples au hotexamples.com: 2

Python Transformer.load - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de model.Transformer.load extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

parameters(30)

Transformer(30)

load_state_dict(30)

eval(30)

cuda(13)

encode(5)

encoder(4)

decoder(4)

decode(4)

out(3)

load_dict(3)

load(2)

add_loss_op(2)

new(2)

generate_square_subsequent_mask(2)

beam_search(2)

get_trainable_parameters(2)

infer(2)

Transformer_decoder(1)

gen_js(1)

get_masks(1)

greedy_search(1)

inference(1)

load_from_checkpoint(1)

init(1)

eval_smaple(1)

load_model(1)

Embeddings(1)

load_weights(1)

make_src_mask(1)

make_trg_mask(1)

multi_gpu_train(1)

fit(1)

eval_gen(1)

eval_ppl(1)

compile(1)

add_optimizer(1)

apply(1)

apply_collective_grads(1)

batch_split_train(1)

build_graph(1)

build_test_model(1)

build_train_model(1)

calculate_loss(1)

clear_gradients(1)

compute_loss(1)

Transformer_encoder(1)

cpu(1)

create_model(1)

PositionwiseFeedForward(1)

Méthodes fréquemment utilisées

parameters (30)

Transformer (30)

load_state_dict (30)

eval (30)

cuda (13)

encode (5)

encoder (4)

decoder (4)

decode (4)

out (3)

Méthodes fréquemment utilisées

load_dict (3)

load (2)

add_loss_op (2)

new (2)

generate_square_subsequent_mask (2)

beam_search (2)

get_trainable_parameters (2)

infer (2)

Transformer_decoder (1)

gen_js (1)

get_masks (1)

greedy_search (1)

inference (1)

load_from_checkpoint (1)

init (1)

eval_smaple (1)

load_model (1)

Embeddings (1)

load_weights (1)

make_src_mask (1)

Méthodes fréquemment utilisées

get_masks (1)

greedy_search (1)

inference (1)

load_from_checkpoint (1)

init (1)

eval_smaple (1)

load_model (1)

Embeddings (1)

load_weights (1)

make_src_mask (1)

make_trg_mask (1)

multi_gpu_train (1)

fit (1)

eval_gen (1)

eval_ppl (1)

compile (1)

add_optimizer (1)

apply (1)

apply_collective_grads (1)

batch_split_train (1)

build_graph (1)

build_test_model (1)

build_train_model (1)

calculate_loss (1)

clear_gradients (1)

compute_loss (1)

Transformer_encoder (1)

cpu (1)

create_model (1)

PositionwiseFeedForward (1)

Méthodes fréquemment utilisées

make_trg_mask (1)

multi_gpu_train (1)

fit (1)

eval_gen (1)

eval_ppl (1)

compile (1)

add_optimizer (1)

apply (1)

apply_collective_grads (1)

batch_split_train (1)

build_graph (1)

build_test_model (1)

build_train_model (1)

calculate_loss (1)

clear_gradients (1)

compute_loss (1)

Transformer_encoder (1)

cpu (1)

create_model (1)

PositionwiseFeedForward (1)

debug (1)

DecoderLayer (1)

PositionalEncoding (1)

MultiHeadedAttention (1)

EncoderLayer (1)

Encoder (1)

Decoder (1)

Exemple #1

0

Afficher le fichier

Fichier : main.py Projet : vbkaisetsu/transformer_primitiv

def main(config): mode = config['mode'] if mode == 'preproc': preproc(config) return print('initializing device ...', end='', file=sys.stderr, flush=True) dev = D.Naive() if config['gpu'] < 0 else D.CUDA(config['gpu']) Device.set_default(dev) print("done.", file=sys.stderr, flush=True) prefix = config['model_prefix'] if mode == 'train': model = Transformer(config['n_heads'], config['n_stacks'], config['dropout'], config['generation_limit']) model.init(config['vocabulary_size'], config['d_model'], config['d_ff']) optimizer = O.Adam(alpha=1, beta2=0.98, eps=1e-9) optimizer.set_gradient_clipping(5) train(model, optimizer, config, 1e10) elif mode == 'resume': print('loading model/optimizer ... ', end='', file=sys.stderr, flush=True) model = Transformer(config['n_heads'], config['n_stacks'], config['dropout'], config['generation_limit']) model.load(prefix + '.model') optimizer = O.Adam(alpha=1, beta2=0.98, eps=1e-9) optimizer.set_gradient_clipping(5) optimizer.load(prefix + '.optimizer') with Path(prefix).with_suffix('.valid').open() as f: valid_ppl = float(f.read().strip()) print('done.', file=sys.stderr, flush=True) train(model, optimizer, config, valid_ppl) elif mode == 'test': model = Transformer(config['n_heads'], config['n_stacks'], config['dropout'], config['generation_limit']) model.load(prefix + '.model') test(model, config)

Exemple #2

0

Afficher le fichier

def run_validation(epoch, dataset_name: str): dataset = load_data(dataset_name) print("Number of %s instances: %d" % (dataset_name, len(dataset))) model = Transformer( i2w=i2w, use_knowledge=args.use_knowledge, args=args, test=True ).cuda() model.load("{0}model_{1}.bin".format(args.save_path, epoch)) model.transformer.eval() # Iterate over batches num_batches = math.ceil(len(dataset) / args.batch_size) cum_loss = 0 cum_words = 0 predicted_sentences = [] indices = list(range(len(dataset))) for batch in tqdm(range(num_batches)): # Prepare batch batch_indices = indices[batch * args.batch_size : (batch + 1) * args.batch_size] batch_rows = [dataset[i] for i in batch_indices] # Encode batch. If facts are being used, they'll be prepended to the input input_seq, input_lens, target_seq, target_lens = model.prep_batch(batch_rows) # Decode batch predicted_sentences += model.decode(input_seq, input_lens) # Evaluate batch cum_loss += model.eval_ppl(input_seq, input_lens, target_seq, target_lens) cum_words += (target_seq != w2i["_pad"]).sum().item() # Log epoch ppl = math.exp(cum_loss / cum_words) print("{} Epoch: {} PPL: {}".format(dataset_name, epoch, ppl)) # Save predictions open( "{0}{1}_epoch_{2}.pred".format(args.save_path, dataset_name, str(epoch)), "w+" ).writelines([l + "\n" for l in predicted_sentences])