Python ShmemVecEnv.eval 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: baselines.common.vec_env.shmem_vec_env

클래스/타입: ShmemVecEnv

메소드/함수: eval

hotexamples.com에서의 예제들: 2

Python ShmemVecEnv.eval - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 baselines.common.vec_env.shmem_vec_env.ShmemVecEnv.eval에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

ShmemVecEnv(30)

eval(2)

reset(2)

step(2)

load_running_average(1)

ob_rms(1)

observation_shape(1)

observation_space(1)

render(1)

예제 #1

파일 보기

def make_vec_envs(
    env_name,
    seed,
    num_processes,
    gamma,
    log_dir,
    device,
    allow_early_resets,
    training=True,
    num_frame_stack=None,
    red=False,
):
    envs = [
        make_env(env_name, seed, i, log_dir, allow_early_resets)
        for i in range(num_processes)
    ]

    if len(envs) > 1:
        envs = ShmemVecEnv(envs, context='fork')
    else:
        envs = DummyVecEnv(envs)

    # Dont filter if RED
    obfilt = not red
    if len(envs.observation_space.shape) == 1:
        if gamma is None:
            envs = VecNormalize(envs, ob=obfilt, ret=False)
        else:
            envs = VecNormalize(envs, ob=obfilt, gamma=gamma)
        if not training:
            envs.eval()

    elif env_name.startswith('CarRacing'):
        # Car Racing, use a normalizer for rewards
        envs = VecNormalize(envs,
                            ob=False,
                            ret=training,
                            clipob=1e10,
                            cliprew=1.0)
        if not training:
            envs.eval()

    envs = VecPyTorch(envs, device)
    # Hack for now
    is_atari = env_name.startswith('MiniGrid') or env_name.startswith(
        'CarRacing')
    is_atari = not is_atari

    if num_frame_stack is not None:
        envs = VecPyTorchFrameStack(envs, num_frame_stack, device)
    elif len(envs.observation_space.shape) == 3:
        envs = VecPyTorchFrameStack(envs, 4, device)

    return envs

예제 #2

파일 보기

def make_vec_envs(env_id,
                  seed,
                  num_processes,
                  gamma,
                  log_dir=None,
                  device=torch.device('cpu'),
                  obs_keys=None,
                  allow_early_resets=False,
                  save_video=False,
                  num_frame_stack=None,
                  max_steps=None,
                  evaluating=False):
    envs = [
        make_env(env_id,
                 seed,
                 i,
                 log_dir,
                 obs_keys,
                 allow_early_resets,
                 save_video,
                 max_steps=max_steps) for i in range(num_processes)
    ]

    if len(envs) > 1:
        envs = ShmemVecEnv(envs, context='fork')
    else:
        envs = DummyVecEnv(envs)

    if len(envs.observation_space.shape) == 1:
        if gamma is None:
            envs = VecNormalize(envs, ret=False)
        else:
            envs = VecNormalize(envs, gamma=gamma)

        # since our network is frozen, an online normalization would make observations diverge from what it learned
        if evaluating:
            envs.eval()

    envs = VecPyTorch(envs, device)

    if num_frame_stack is not None:
        envs = VecPyTorchFrameStack(envs, num_frame_stack, device)
    elif len(envs.observation_space.shape) == 3:
        envs = VecPyTorchFrameStack(envs, 4, device)

    return envs