Python VecNormalize.training 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: stable_baselines.common.vec_env

클래스/타입: VecNormalize

메소드/함수: training

hotexamples.com에서의 예제들: 2

Python VecNormalize.training - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 stable_baselines.common.vec_env.VecNormalize.training에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

VecNormalize(30)

load(14)

step(11)

reset(11)

save(5)

load_running_average(4)

save_running_average(4)

close(4)

set_attr(2)

normalize_obs(2)

env_method(2)

training(2)

__getstate__(1)

normalize_reward(1)

pop_transitions(1)

render(1)

get_original_obs(1)

alrs(1)

__new__(1)

__init__(1)

예제 #1

파일 보기

def _add_normalization_wrapper(env, n_envs, normalize):
    if isinstance(normalize, bool):
        env = VecNormalize(env)
    elif isinstance(normalize, dict):
        if 'trained_agent' in normalize:
            path = normalize.pop('trained_agent')
            env = VecNormalize.load(path, env)
            env.training = normalize.pop('training', True)
        elif normalize.pop('precompute', False):
            samples = normalize.pop('samples', 10000)
            env = _precompute_normalization(env, n_envs, samples, normalize)
        else:
            env = VecNormalize(env, **normalize)
    return env

예제 #2

파일 보기

def _precompute_normalization(env, num_envs, samples, config):
    env = VecNormalize(env, training=True, **config)

    logging.info("Precomputing normalization. This may take a while.")
    env.reset()
    log_step = 5000 // num_envs
    for i in range(samples // num_envs):
        actions = [env.action_space.sample() for _ in range(num_envs)]
        obs, rewards, dones, info = env.step(actions)

        if i % log_step == 0:
            logging.info("Progress: {}/{}".format(i * num_envs, samples))

    logging.info("Successfully precomputed normalization parameters.")
    env.reset()
    env.training = False
    return env