Python TrainingParam.initial_epsilon Exemples

Langage de programmation: Python

Espace de nommage/Pack: l2rpn_baselines.utils

Class/Type: TrainingParam

Méthode/Fonction: initial_epsilon

Exemples au hotexamples.com: 2

Python TrainingParam.initial_epsilon - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de l2rpn_baselines.utils.TrainingParam.initial_epsilon extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

TrainingParam(20)

minibatch_size(8)

update_freq(7)

buffer_size(6)

min_observation(6)

final_epsilon(3)

save_as_json(3)

update_nb_iter(2)

step_increase_nb_iter(2)

from_json(2)

oversampling_rate(2)

min_observe(2)

min_iter(2)

lr(2)

initial_epsilon(2)

random_sample_datetime_start(1)

sample_one_random_action_begin(1)

lr_decay_steps(1)

save_model_each(1)

step_for_final_epsilon(1)

get_next_epsilon(1)

update_tensorboard_freq(1)

Méthodes fréquemment utilisées

TrainingParam (20)

minibatch_size (8)

update_freq (7)

buffer_size (6)

min_observation (6)

final_epsilon (3)

save_as_json (3)

update_nb_iter (2)

step_increase_nb_iter (2)

from_json (2)

Méthodes fréquemment utilisées

oversampling_rate (2)

min_observe (2)

min_iter (2)

lr (2)

initial_epsilon (2)

random_sample_datetime_start (1)

sample_one_random_action_begin (1)

lr_decay_steps (1)

save_model_each (1)

step_for_final_epsilon (1)

get_next_epsilon (1)

update_tensorboard_freq (1)

Méthodes fréquemment utilisées

get_next_epsilon (1)

update_tensorboard_freq (1)

Exemple #1

0

Afficher le fichier

def test_get_epsilon(self): tp = TrainingParam() tp.final_epsilon = None eps = tp.get_next_epsilon(1) assert eps == 0. tp.final_epsilon = 0.01 tp.initial_epsilon = None eps = tp.get_next_epsilon(1) assert eps == 0. tp.initial_epsilon = 0.01 tp.final_epsilon = 0.01 eps = tp.get_next_epsilon(1) assert eps == 0.01

Exemple #2

0

Afficher le fichier

tp.step_increase_nb_iter = None # None to deactivate it tp.min_iter = None tp.update_nb_iter = None # once 100 scenarios are solved, increase of "step_increase_nb_iter" # oversampling hard scenarios tp.oversampling_rate = None # None to deactivate it # experience replay tp.buffer_size = 1000000 # just observe the data for a while tp.min_observe = None # int(10000) # e greedy tp.min_observation = 128 tp.initial_epsilon = 0.2 tp.final_epsilon = 1./(288.) tp.step_for_final_epsilon = int(1e5) # TODO add the "i dont do anything for a few time steps at the beginning of the training" # don't start always at the same hour (if not None) otherwise random sampling, see docs tp.random_sample_datetime_start = None # saving, logging etc. tp.save_model_each = 10000 tp.update_tensorboard_freq = 256 # which actions i keep if env.name == "l2rpn_case14_sandbox": kwargs_converters = {"all_actions": None, "set_line_status": False,