Exemplos de Critic.cuda em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: critic

Classe / Tipo: Critic

Método / Função: cuda

Exemplos em hotexamples.com: 2

Critic.cuda em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de critic.Critic.cuda em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Critic(30)

parameters(24)

load_state_dict(10)

get_action_gradients(9)

state_dict(9)

gradients(7)

save(6)

forward(5)

eval(4)

learn(4)

predict(3)

load(3)

action_gradients(3)

predict_rewards(3)

Q1(2)

get_weights(2)

load_checkpoint(2)

get_q(2)

model(2)

get_gradients(2)

predict_target(2)

get_action_grads(2)

next_q_value(2)

action_grad(2)

build(2)

set_weights(2)

save_weights(2)

copy_weights(2)

create_critic_model(2)

cuda(2)

save_model(1)

save_checkpoint(1)

predict_q_val(1)

return_q_and_out(1)

q1(1)

optimizer(1)

soft_update(1)

optimize_q_val(1)

hard_update_target_network(1)

network(1)

dq_da(1)

Q2(1)

__init__(1)

calc_grads(1)

compile(1)

create_value_net(1)

critic_target_update(1)

find_action_grads(1)

named_parameters(1)

gamma(1)

Métodos Frequentes

Critic (30)

parameters (24)

load_state_dict (10)

get_action_gradients (9)

state_dict (9)

gradients (7)

save (6)

forward (5)

eval (4)

learn (4)

Métodos Frequentes

predict (3)

load (3)

action_gradients (3)

predict_rewards (3)

Q1 (2)

get_weights (2)

load_checkpoint (2)

get_q (2)

model (2)

get_gradients (2)

predict_target (2)

get_action_grads (2)

next_q_value (2)

action_grad (2)

build (2)

set_weights (2)

save_weights (2)

copy_weights (2)

create_critic_model (2)

cuda (2)

Métodos Frequentes

predict_target (2)

get_action_grads (2)

next_q_value (2)

action_grad (2)

build (2)

set_weights (2)

save_weights (2)

copy_weights (2)

create_critic_model (2)

cuda (2)

save_model (1)

save_checkpoint (1)

predict_q_val (1)

return_q_and_out (1)

q1 (1)

optimizer (1)

soft_update (1)

optimize_q_val (1)

hard_update_target_network (1)

network (1)

dq_da (1)

Q2 (1)

__init__ (1)

calc_grads (1)

compile (1)

create_value_net (1)

critic_target_update (1)

find_action_grads (1)

named_parameters (1)

gamma (1)

Métodos Frequentes

save_model (1)

save_checkpoint (1)

predict_q_val (1)

return_q_and_out (1)

q1 (1)

optimizer (1)

soft_update (1)

optimize_q_val (1)

hard_update_target_network (1)

network (1)

dq_da (1)

Q2 (1)

__init__ (1)

calc_grads (1)

compile (1)

create_value_net (1)

critic_target_update (1)

find_action_grads (1)

named_parameters (1)

gamma (1)

get_Q_value (1)

get_gradient (1)

get_qs (1)

initialize_target_network (1)

load_model (1)

load_weights (1)

step (1)

Exemplo n.º 1

0

Exibir arquivo

def train(): experiences_buffer = deque(maxlen=config.MAX_EXPERIENCES_SIZE) word2vec = LightWord2Vec() lang = Lang(word2vec.get_vocab()) actor = ActorCopy(config.EMBEDDING_SIZE, config.STATE_SIZE, lang, word2vec) critic = Critic(config.STATE_SIZE, config.EMBEDDING_SIZE, config.CRITIC_HIDDEN_SIZE) reader = DataSetReader('train') critic_optimizer = torch.optim.Adam(critic.parameters()) critic_criterion = torch.nn.MSELoss() actor_optimizer = torch.optim.Adam(actor.parameters()) if LOAD_INDEX > -1: actor, critic, critic_optimizer, critic_criterion, actor_optimizer, lang = load_model( LOAD_INDEX) if torch.cuda.is_available(): actor.cuda() critic.cuda() for epoch in range(LOAD_INDEX + 1, config.EPOCHS): # training actor for x, y in reader.read(config.TRAIN_BATCH_SIZE): for sentence, target_sentence in zip(x, y): states, actions, probs = actor( sentence, get_possible_actions(lang, sentence)) predicted_sentence = actions[:-1] # Skip None rewards = [ sari_reward(sentence[:i + 1], predicted_sentence[:i + 1], target_sentence[:i + 1]) for i in range( max(len(target_sentence), len(predicted_sentence))) ] + [0] for i in range(len(states) - 1): experiences_buffer.insert( 0, Experience(states[i], actions[i], states[i + 1], rewards[i], probs[i], sentence)) q_estimated = [] q_s = torch.zeros(config.Q_BATCH_SIZE, 1) # training q function exp_length = min(len(experiences_buffer), config.Q_BATCH_SIZE) for idx in range(exp_length): exp = experiences_buffer[random.randint(0, exp_length - 1)] action_emb = word2vec[exp.action] q_estimated.append(critic(exp.state, action_emb)[0, 0]) q_s[idx] = exp.reward if exp.next_state is not None: with torch.no_grad(): q_s[idx] += (config.GAMMA * max([ critic(exp.next_state, word2vec[action]) for action in get_possible_actions(lang, exp.sentence) ]))[0][0] q_estimated = torch.cat(q_estimated).view(-1, 1) q_estimated = q_estimated[:config.Q_BATCH_SIZE] critic_optimizer.zero_grad() loss = critic_criterion(q_s, q_estimated) loss.backward(retain_graph=True) critic_optimizer.step() # updating seq2seq model actor_optimizer.zero_grad() loss = shared_loss(experiences_buffer, q_estimated[:exp_length]) loss.backward() actor_optimizer.step() experiences_buffer.clear() with torch.no_grad(): actor.zero_grad() critic.zero_grad() if epoch % 100 == 0: save_model(epoch, actor, critic, critic_optimizer, critic_criterion, actor_optimizer, lang) print("Finished epoch:", epoch, " loss is ", torch.sum(loss))

Exemplo n.º 2

0

Exibir arquivo

Arquivo: main.py Projeto: Paandaman/Training-Confidence-Calibrated-Classifiers-For-Detecting-Out-Of-Distribution-Samples

drop_last=True) svhntestloader = data.DataLoader(svhn_testset, shuffle=True, batch_size=m, drop_last=True) latent_distr = torch.distributions.normal.Normal(0, 1) # Networks crit = Critic() gen = Generator(latent_size) classifier = models.vgg13(pretrained=False) # adjust final layer to handle 10 classes classifier.classifier._modules['6'] = torch.nn.Linear(4096, 10) classifier.train() crit.cuda() gen.cuda() classifier.cuda() adversarial_loss = torch.nn.BCELoss() neg_logl = torch.nn.NLLLoss() optimizer = torch.optim.Adam(crit.parameters(), lr=0.0001, betas=(0.5, 0.999)) optimizer_gen = torch.optim.Adam(gen.parameters(), lr=0.0001, betas=(0.5, 0.999)) optimizer_classifier = torch.optim.Adam(classifier.parameters(), lr=0.0001, betas=(0.5, 0.999)) scheduler_d = torch.optim.lr_scheduler.ExponentialLR(optimizer, gamma=0.999)