Python Encoder.zero_grad Exemples

Langage de programmation: Python

Espace de nommage/Pack: models

Class/Type: Encoder

Méthode/Fonction: zero_grad

Exemples au hotexamples.com: 2

Python Encoder.zero_grad - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de models.Encoder.zero_grad extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Encoder(30)

parameters(30)

to(30)

fine_tune(30)

state_dict(28)

load_state_dict(21)

eval(19)

cuda(16)

train(9)

forward(5)

encode(4)

restore_model(4)

deprocess(4)

preprocess(4)

initialize_hidden_state(3)

load(3)

save(3)

save_as_json(3)

apply(3)

create_vector(3)

load_weights(2)

zero_grad(2)

get_weights(1)

collect_params(1)

_forward_old(1)

to_gpu(1)

to_cpu(1)

apply_1(1)

summary(1)

apply_2(1)

share_memory(1)

set_weights(1)

save_weights(1)

save_parameters(1)

build(1)

sample(1)

initialize(1)

restored(1)

cpu(1)

reset_parameters(1)

double(1)

predict(1)

forward2(1)

num_samples(1)

forward_features(1)

freeze_params(1)

get_variables(1)

EmbeddingEncoder(1)

ContextEncoder(1)

Méthodes fréquemment utilisées

Encoder (30)

parameters (30)

to (30)

fine_tune (30)

state_dict (28)

load_state_dict (21)

eval (19)

cuda (16)

train (9)

forward (5)

Méthodes fréquemment utilisées

encode (4)

restore_model (4)

deprocess (4)

preprocess (4)

initialize_hidden_state (3)

load (3)

save (3)

save_as_json (3)

apply (3)

create_vector (3)

load_weights (2)

zero_grad (2)

get_weights (1)

collect_params (1)

_forward_old (1)

to_gpu (1)

to_cpu (1)

apply_1 (1)

summary (1)

apply_2 (1)

Méthodes fréquemment utilisées

load_weights (2)

zero_grad (2)

get_weights (1)

collect_params (1)

_forward_old (1)

to_gpu (1)

to_cpu (1)

apply_1 (1)

summary (1)

apply_2 (1)

share_memory (1)

set_weights (1)

save_weights (1)

save_parameters (1)

build (1)

sample (1)

initialize (1)

restored (1)

cpu (1)

reset_parameters (1)

double (1)

predict (1)

forward2 (1)

num_samples (1)

forward_features (1)

freeze_params (1)

get_variables (1)

EmbeddingEncoder (1)

ContextEncoder (1)

Méthodes fréquemment utilisées

share_memory (1)

set_weights (1)

save_weights (1)

save_parameters (1)

build (1)

sample (1)

initialize (1)

restored (1)

cpu (1)

reset_parameters (1)

double (1)

predict (1)

forward2 (1)

num_samples (1)

forward_features (1)

freeze_params (1)

get_variables (1)

EmbeddingEncoder (1)

ContextEncoder (1)

Exemple #1

0

Afficher le fichier

Fichier : train.py Projet : codekansas/mnist-domain-adaptation

if args.swap_predictors: predictor, adaptor = adaptor, predictor predict_loss_func, adapt_loss_func = adapt_loss_func, predict_loss_func # Creates model optimizers. encoder_optim = optim.Adam(encoder.parameters()) adaptor_optim = optim.Adam(adaptor.parameters()) predictor_optim = optim.Adam(predictor.parameters()) # Keeps track of training progress. metrics = defaultdict(list) # Trains the model. for epoch in range(1, args.num_epoch + 1): for i, (x_data, a_data) in enumerate(train_dataloader, 1): encoder.zero_grad() predictor.zero_grad() adaptor.zero_grad() # Converts Y data to odd-even labels. y_data = (a_data % 2).float() # Swaps the predict and adapt data, if needed. if args.swap_predictors: y_data, a_data = a_data, y_data # Converts the input data to autograd variables. input_variable = Variable(x_data) predict_variable = Variable(y_data) adapt_variable = Variable(a_data)

Exemple #2

0

Afficher le fichier

def main(args): device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') print(f"Training on {device}") if not os.path.exists(args.models_dir): os.makedirs(args.models_dir) if args.build_vocab: print( f"Building vocabulary from captions at {args.captions_json} and with count threshold={args.threshold}" ) vocab_object = build_vocab(args.captions_json, args.threshold) with open(args.vocab_path, "wb") as vocab_f: pickle.dump(vocab_object, vocab_f) print( f"Saved the vocabulary object to {args.vocab_path}, total size={len(vocab_object)}" ) else: with open(args.vocab_path, 'rb') as f: vocab_object = pickle.load(f) print( f"Loaded the vocabulary object from {args.vocab_path}, total size={len(vocab_object)}" ) if args.glove_embed_path is not None: with open(args.glove_embed_path, 'rb') as f: glove_embeddings = pickle.load(f) print( f"Loaded the glove embeddings from {args.glove_embed_path}, total size={len(glove_embeddings)}" ) # We are using 300d glove embeddings args.embed_size = 300 weights_matrix = np.zeros((len(vocab_object), args.embed_size)) for word, index in vocab_object.word2index.items(): if word in glove_embeddings: weights_matrix[index] = glove_embeddings[word] else: weights_matrix[index] = np.random.normal( scale=0.6, size=(args.embed_size, )) weights_matrix = torch.from_numpy(weights_matrix).float().to(device) else: weights_matrix = None img_transforms = transforms.Compose([ transforms.Resize((256, 256)), transforms.RandomCrop((224, 224)), transforms.ToTensor(), transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225)) ]) train_dataset = cocoDataset(args.image_root, args.captions_json, vocab_object, img_transforms) train_dataloader = torch.utils.data.DataLoader( dataset=train_dataset, batch_size=args.batch_size, shuffle=True, num_workers=args.num_workers, collate_fn=collate_fn) encoder = Encoder(args.resnet_size, (3, 224, 224), args.embed_size).to(device) decoder = Decoder(args.rnn_type, weights_matrix, len(vocab_object), args.embed_size, args.hidden_size).to(device) encoder_learnable = list(encoder.linear.parameters()) decoder_learnable = list(decoder.rnn.parameters()) + list( decoder.linear.parameters()) if args.glove_embed_path is None: decoder_learnable = decoder_learnable + list( decoder.embedding.parameters()) criterion = nn.CrossEntropyLoss() params = encoder_learnable + decoder_learnable optimizer = torch.optim.Adam(params, lr=args.learning_rate) start_epoch = 0 if args.ckpt_path is not None: model_ckpt = torch.load(args.ckpt_path) start_epoch = model_ckpt['epoch'] + 1 prev_loss = model_ckpt['loss'] encoder.load_state_dict(model_ckpt['encoder']) decoder.load_state_dict(model_ckpt['decoder']) optimizer.load_state_dict(model_ckpt['optimizer']) print( f"Loaded model and optimizer state from {args.ckpt_path}; start epoch at {start_epoch}; prev loss={prev_loss}" ) total_examples = len(train_dataloader) for epoch in range(start_epoch, args.num_epochs): for i, (images, captions, lengths) in enumerate(train_dataloader): images = images.to(device) captions = captions.to(device) targets = pack_padded_sequence(captions, lengths, batch_first=True).data image_embeddings = encoder(images) outputs = decoder(image_embeddings, captions, lengths) loss = criterion(outputs, targets) decoder.zero_grad() encoder.zero_grad() loss.backward() optimizer.step() if i % args.log_interval == 0: loss_val = "{:.4f}".format(loss.item()) perplexity_val = "{:5.4f}".format(np.exp(loss.item())) print( f"epoch=[{epoch}/{args.num_epochs}], iteration=[{i}/{total_examples}], loss={loss_val}, perplexity={perplexity_val}" ) torch.save( { 'epoch': epoch, 'encoder': encoder.state_dict(), 'decoder': decoder.state_dict(), 'optimizer': optimizer.state_dict(), 'loss': loss }, os.path.join(args.models_dir, 'model-after-epoch-{}.ckpt'.format(epoch)))