Exemplos de VecNormalize.training em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: stable_baselines.common.vec_env

Classe / Tipo: VecNormalize

Método / Função: training

Exemplos em hotexamples.com: 2

VecNormalize.training em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de stable_baselines.common.vec_env.VecNormalize.training em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

VecNormalize(30)

load(14)

step(11)

reset(11)

save(5)

load_running_average(4)

save_running_average(4)

close(4)

set_attr(2)

normalize_obs(2)

env_method(2)

training(2)

__getstate__(1)

normalize_reward(1)

pop_transitions(1)

render(1)

get_original_obs(1)

alrs(1)

__new__(1)

__init__(1)

Métodos Frequentes

VecNormalize (30)

load (14)

step (11)

reset (11)

save (5)

load_running_average (4)

save_running_average (4)

close (4)

set_attr (2)

normalize_obs (2)

Métodos Frequentes

env_method (2)

training (2)

__getstate__ (1)

normalize_reward (1)

pop_transitions (1)

render (1)

get_original_obs (1)

alrs (1)

__new__ (1)

__init__ (1)

Exemplo n.º 1

0

Exibir arquivo

def _add_normalization_wrapper(env, n_envs, normalize): if isinstance(normalize, bool): env = VecNormalize(env) elif isinstance(normalize, dict): if 'trained_agent' in normalize: path = normalize.pop('trained_agent') env = VecNormalize.load(path, env) env.training = normalize.pop('training', True) elif normalize.pop('precompute', False): samples = normalize.pop('samples', 10000) env = _precompute_normalization(env, n_envs, samples, normalize) else: env = VecNormalize(env, **normalize) return env

Exemplo n.º 2

0

Exibir arquivo

def _precompute_normalization(env, num_envs, samples, config): env = VecNormalize(env, training=True, **config) logging.info("Precomputing normalization. This may take a while.") env.reset() log_step = 5000 // num_envs for i in range(samples // num_envs): actions = [env.action_space.sample() for _ in range(num_envs)] obs, rewards, dones, info = env.step(actions) if i % log_step == 0: logging.info("Progress: {}/{}".format(i * num_envs, samples)) logging.info("Successfully precomputed normalization parameters.") env.reset() env.training = False return env