Python DummyVecEnv.get_original_obs 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: stable_baselines.common.vec_env

클래스/타입: DummyVecEnv

메소드/함수: get_original_obs

hotexamples.com에서의 예제들: 2

Python DummyVecEnv.get_original_obs - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 stable_baselines.common.vec_env.DummyVecEnv.get_original_obs에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DummyVecEnv(30)

step(30)

close(30)

render(30)

env_method(24)

reset(19)

get_attr(6)

training(4)

set_attr(4)

seed(4)

save(4)

load_running_average(3)

save_running_average(3)

norm_reward(3)

get_original_obs(2)

append(2)

keyboard_map(1)

get_episode_rewards(1)

action_space(1)

set_obs(1)

base_env(1)

exit(1)

get_episode_constraints(1)

reward_range(1)

model(1)

reset_monitor(1)

get_images(1)

observation_space(1)

normalize_reward(1)

normalize_obs(1)

_normalize_observation(1)

wait(1)

예제 #1

파일 보기

def _make_warmstart_cartpole():
    """Warm-start VecNormalize by stepping through CartPole"""
    venv = DummyVecEnv([lambda: gym.make("CartPole-v1")])
    venv = VecNormalize(venv)
    venv.reset()
    venv.get_original_obs()

    for _ in range(100):
        actions = [venv.action_space.sample()]
        venv.step(actions)
    return venv

예제 #2

파일 보기

파일: test_vec_normalize.py 프로젝트: zlw21gxy/stable-baselines

def test_sync_vec_normalize():
    env = DummyVecEnv([make_env])

    assert unwrap_vec_normalize(env) is None

    env = VecNormalize(env, norm_obs=True, norm_reward=True, clip_obs=10., clip_reward=10.)

    assert isinstance(unwrap_vec_normalize(env), VecNormalize)

    env = VecFrameStack(env, 1)

    assert isinstance(unwrap_vec_normalize(env), VecNormalize)

    eval_env = DummyVecEnv([make_env])
    eval_env = VecNormalize(eval_env, training=False, norm_obs=True, norm_reward=True, clip_obs=10., clip_reward=10.)
    eval_env = VecFrameStack(eval_env, 1)

    env.reset()
    # Initialize running mean
    for _ in range(100):
        env.step([env.action_space.sample()])

    obs = env.reset()
    original_obs = env.get_original_obs()
    # Normalization must be different
    assert not np.allclose(obs, eval_env.normalize_obs(original_obs))

    sync_envs_normalization(env, eval_env)

    # Now they must be synced
    assert np.allclose(obs, eval_env.normalize_obs(original_obs))