Esempi in Python per FlattenDictWrapper.step

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: gym.wrappers

Classe/tipologia: FlattenDictWrapper

Metodo/funzione: step

Esempi su hotexamples.com: 2

FlattenDictWrapper.step in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per gym.wrappers.FlattenDictWrapper.step, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

FlattenDictWrapper(24)

seed(4)

reset(2)

step(2)

close(1)

observation(1)

render(1)

Esempio n. 1

Mostra file

def random_rollout(spec, kwargs):
    env = FlattenDictWrapper(spec.make(**kwargs), ['observation', 'desired_goal', 'achieved_goal'])
    agent = lambda ob: env.action_space.sample()
    ob = env.reset()
    for _ in range(10):
        assert env.observation_space.contains(ob)
        a = agent(ob)
        assert env.action_space.contains(a)
        (ob, _reward, done, _info) = env.step(a)
        if done:
            break
    env.close()

Esempio n. 2

Mostra file

def environment(spec, kwargs):
    env = FlattenDictWrapper(spec.make(**kwargs), ['observation', 'desired_goal', 'achieved_goal'])
    ob_space = env.observation_space
    act_space = env.action_space
    ob = env.reset()
    assert ob_space.contains(ob), 'Reset observation: {!r} not in space'.format(ob)
    a = act_space.sample()
    observation, reward, done, _info = env.step(a)
    assert ob_space.contains(observation), 'Step observation: {!r} not in space'.format(observation)
    assert np.isscalar(reward), "{} is not a scalar for {}".format(reward, env)
    assert isinstance(done, bool), "Expected {} to be a boolean".format(done)

    for mode in env.metadata.get('render.modes', []):
        env.render(mode=mode)

    # Make sure we can render the environment after close.
    for mode in env.metadata.get('render.modes', []):
        env.render(mode=mode)

    env.close()