Python DummyVecEnv.get_original_obs示例

编程语言: Python

命名空间/包名称: stable_baselines.common.vec_env

类/类型: DummyVecEnv

方法/功能: get_original_obs

hotexamples.com的示例: 2

Python DummyVecEnv.get_original_obs - 已找到2个示例。这些是从开源项目中提取的最受好评的stable_baselines.common.vec_env.DummyVecEnv.get_original_obs现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

DummyVecEnv(30)

step(30)

close(30)

render(30)

env_method(24)

reset(19)

get_attr(6)

training(4)

set_attr(4)

seed(4)

save(4)

load_running_average(3)

save_running_average(3)

norm_reward(3)

get_original_obs(2)

append(2)

keyboard_map(1)

get_episode_rewards(1)

action_space(1)

set_obs(1)

base_env(1)

exit(1)

get_episode_constraints(1)

reward_range(1)

model(1)

reset_monitor(1)

get_images(1)

observation_space(1)

normalize_reward(1)

normalize_obs(1)

_normalize_observation(1)

wait(1)

示例#1

显示文件

def _make_warmstart_cartpole():
    """Warm-start VecNormalize by stepping through CartPole"""
    venv = DummyVecEnv([lambda: gym.make("CartPole-v1")])
    venv = VecNormalize(venv)
    venv.reset()
    venv.get_original_obs()

    for _ in range(100):
        actions = [venv.action_space.sample()]
        venv.step(actions)
    return venv

示例#2

显示文件

文件： test_vec_normalize.py 项目： zlw21gxy/stable-baselines

def test_sync_vec_normalize():
    env = DummyVecEnv([make_env])

    assert unwrap_vec_normalize(env) is None

    env = VecNormalize(env, norm_obs=True, norm_reward=True, clip_obs=10., clip_reward=10.)

    assert isinstance(unwrap_vec_normalize(env), VecNormalize)

    env = VecFrameStack(env, 1)

    assert isinstance(unwrap_vec_normalize(env), VecNormalize)

    eval_env = DummyVecEnv([make_env])
    eval_env = VecNormalize(eval_env, training=False, norm_obs=True, norm_reward=True, clip_obs=10., clip_reward=10.)
    eval_env = VecFrameStack(eval_env, 1)

    env.reset()
    # Initialize running mean
    for _ in range(100):
        env.step([env.action_space.sample()])

    obs = env.reset()
    original_obs = env.get_original_obs()
    # Normalization must be different
    assert not np.allclose(obs, eval_env.normalize_obs(original_obs))

    sync_envs_normalization(env, eval_env)

    # Now they must be synced
    assert np.allclose(obs, eval_env.normalize_obs(original_obs))