Python Updater.calc_loss Exemples

Langage de programmation: Python

Espace de nommage/Pack: updater

Class/Type: Updater

Méthode/Fonction: calc_loss

Exemples au hotexamples.com: 2

Python Updater.calc_loss - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de updater.Updater.calc_loss extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Updater(30)

do_update(5)

download_tarball(5)

get_tarball_url(4)

add_info(3)

entr_coef(2)

blank_line(2)

epsilon(2)

apply_patch_check(2)

apply_patch(2)

check_device(2)

delete(2)

check(2)

check_update(2)

add(2)

calc_loss(2)

end_table_connect(1)

empty(1)

download_update(1)

done(1)

doesEntryListContain(1)

do_update_phase2(1)

evaluate(1)

fetch_update(1)

execute(1)

fetch_countries(1)

firstUpdate(1)

getResult(1)

get_ip(1)

get_updated_addons(1)

remove(1)

runrequest(1)

set_zone_ip(1)

sprites(1)

updateFile(1)

update_ips(1)

do_update_phase1(1)

Client(1)

doUpdate(1)

addSuppress(1)

ExecUpd(1)

abort(1)

addClass(1)

addFilter(1)

addGenerator(1)

addMessage(1)

addReference(1)

addReferenceType(1)

addRule(1)

addRuleSet(1)

Méthodes fréquemment utilisées

Updater (30)

do_update (5)

download_tarball (5)

get_tarball_url (4)

add_info (3)

entr_coef (2)

blank_line (2)

epsilon (2)

apply_patch_check (2)

apply_patch (2)

Méthodes fréquemment utilisées

check_device (2)

delete (2)

check (2)

check_update (2)

add (2)

calc_loss (2)

end_table_connect (1)

empty (1)

download_update (1)

done (1)

doesEntryListContain (1)

do_update_phase2 (1)

evaluate (1)

fetch_update (1)

execute (1)

fetch_countries (1)

firstUpdate (1)

getResult (1)

get_ip (1)

get_updated_addons (1)

Méthodes fréquemment utilisées

doesEntryListContain (1)

do_update_phase2 (1)

evaluate (1)

fetch_update (1)

execute (1)

fetch_countries (1)

firstUpdate (1)

getResult (1)

get_ip (1)

get_updated_addons (1)

remove (1)

runrequest (1)

set_zone_ip (1)

sprites (1)

updateFile (1)

update_ips (1)

do_update_phase1 (1)

Client (1)

doUpdate (1)

addSuppress (1)

ExecUpd (1)

abort (1)

addClass (1)

addFilter (1)

addGenerator (1)

addMessage (1)

addReference (1)

addReferenceType (1)

addRule (1)

addRuleSet (1)

Méthodes fréquemment utilisées

remove (1)

runrequest (1)

set_zone_ip (1)

sprites (1)

updateFile (1)

update_ips (1)

do_update_phase1 (1)

Client (1)

doUpdate (1)

addSuppress (1)

ExecUpd (1)

abort (1)

addClass (1)

addFilter (1)

addGenerator (1)

addMessage (1)

addReference (1)

addReferenceType (1)

addRule (1)

addRuleSet (1)

apply_patch_check_sp (1)

doCheck (1)

apply_patch_sp (1)

calc_gradients (1)

checkForUpdate (1)

checkUpdates (1)

check_for_update (1)

check_for_updates (1)

collisions (1)

createTable (1)

CreateUpd (1)

delete_recursive (1)

discount (1)

update_switches (1)

Exemple #1

0

Afficher le fichier

Fichier : debug_entry.py Projet : grantsrb/Exploratory-MultiAgent-Snake

lr, entropy_const=entropy_const, value_const=val_const, gamma=gamma, _lambda=_lambda, max_norm=max_norm, norm_advs=norm_advs) if resume: updater.net.load_state_dict(torch.load(exp_name + '_net.p')) updater.optim.load_state_dict(torch.load(exp_name + '_optim.p')) updater.optim.zero_grad() epoch = 0 while True: epoch += 1 print("Begin Epoch", epoch, "– T =", collector.T) for rollout in range(n_rollouts): data = collector.get_data(render) updater.calc_loss(*data, gae, reinforce) updater.update_model() updater.save_model(net_save_file, optim_save_file) updater.print_statistics() print("Grad Norm:", updater.norm, "– Avg Action:", np.mean(data[3])) print("Average Reward:", collector.avg_reward, end='\n\n') # Check for memory leaks gc.collect() max_mem_used = resource.getrusage(resource.RUSAGE_SELF).ru_maxrss print("Memory Used: {:.2f} memory\n".format(max_mem_used / 1024))

Exemple #2

0

Afficher le fichier

T = 0 avg_rew = 0.5 epoch = 0 trial = 0 while T < total_steps: epoch += 1 # Collect Rollout data = collector.rollout(n_tsteps) avg_rew = .99 * avg_rew + .01 * np.mean(data['rewards']) T += n_tsteps * n_envs # Update Model if evaluate_mode: logger.data["Trial " + str(epoch)] = np.asarray(data['rewards']) else: updater.calc_loss(data) if epoch % epochs_per_update == 0: print("\nStep:", T, " – Epoch", epoch) avg_val = np.mean(data['values']) avg_action = np.mean(data['sparse_actions']) print("Avg Rew:", avg_rew, " – Avg Act:", avg_action, " – Avg Val:", avg_val) updater.update_model(calc_grad=True) # Track Stats updater.print_stats() updater.info["Avg Reward"] = avg_rew updater.info["Avg Action"] = avg_action updater.info["Avg Value Pred"] = avg_val logger.append(updater.info, x_val=T) updater.save_model(save_file)