Exemplos de NormalizedBoxEnv.reset em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: rlkit.envs.wrappers

Classe / Tipo: NormalizedBoxEnv

Método / Função: reset

Exemplos em hotexamples.com: 2

NormalizedBoxEnv.reset em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de rlkit.envs.wrappers.NormalizedBoxEnv.reset em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

NormalizedBoxEnv(30)

log_diagnostics(9)

get_all_task_idx(5)

reset(2)

reset_task(2)

seed(2)

step(2)

draw(1)

get_diagnostics(1)

observation_space(1)

render(1)

save_all_tasks(1)

tasks(1)

Métodos Frequentes

NormalizedBoxEnv (30)

log_diagnostics (9)

get_all_task_idx (5)

reset (2)

reset_task (2)

seed (2)

step (2)

draw (1)

get_diagnostics (1)

observation_space (1)

Métodos Frequentes

render (1)

save_all_tasks (1)

tasks (1)

Exemplo n.º 1

0

Exibir arquivo

import gym from rlkit.envs.point_robot import PointEnv import numpy as np from rlkit.envs import ENVS from rlkit.envs.wrappers import NormalizedBoxEnv print(ENVS) env = NormalizedBoxEnv(ENVS['point-robot']()) traj = [] obs = env.reset() traj.append(obs) while True: action = env.action_space.sample() # action = np.array([2.0, 2.0]) print(action) obs, rew, d, _ = env.step(action) print(obs, rew) traj.append(obs) env.render() if d: break print(traj) states = np.array(traj) import numpy as np import matplotlib

Exemplo n.º 2

0

Exibir arquivo

Arquivo: env_visual.py Projeto: maxiaoba/rlkit

import numpy as np import time import argparse from rlkit.envs.wrappers import NormalizedBoxEnv parser = argparse.ArgumentParser() parser.add_argument('--exp_name', type=str, default='Ant') parser.add_argument('--ml', type=int, default=1000) args = parser.parse_args() import gym env = NormalizedBoxEnv(gym.make(args.exp_name+'-v2')) o = env.reset() # print(env.observation_space.high) max_path_length = args.ml path_length = 0 done = False c_r = 0.0 while (path_length < max_path_length) and (not done): path_length += 1 a = env.action_space.sample() o, r, done, _ = env.step(a) c_r += r env.render() print("step: ",path_length) print("o_max: ",np.max(o),np.argmax(o)) print("o_mean: ",np.mean(o)) print("a: ",a) print('r: ',r) print(done)