Exemplos de Monitor.get_initial_state em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: gym.wrappers

Classe / Tipo: Monitor

Método / Função: get_initial_state

Exemplos em hotexamples.com: 3

Monitor.get_initial_state em Python - 3 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de gym.wrappers.Monitor.get_initial_state em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Monitor(30)

step(30)

seed(30)

reset(30)

close(30)

render(30)

get_initial_state(3)

get_observed_state_space(3)

get_episode_rewards(3)

reset_task(2)

get_reward_function(2)

get_transition_function(2)

configure(2)

get_action(1)

do_render(1)

__init__(1)

action_from_ttc(1)

reset_sim(1)

actionInterpreter(1)

run(1)

sample_tasks(1)

_max_episode_steps(1)

set_logger(1)

set_monitor(1)

set_q_values(1)

_max_episode_seconds(1)

uncolor_board(1)

video_callable(1)

Métodos Frequentes

Monitor (30)

step (30)

seed (30)

reset (30)

close (30)

render (30)

get_initial_state (3)

get_observed_state_space (3)

get_episode_rewards (3)

reset_task (2)

Métodos Frequentes

get_reward_function (2)

get_transition_function (2)

configure (2)

get_action (1)

do_render (1)

__init__ (1)

action_from_ttc (1)

reset_sim (1)

actionInterpreter (1)

run (1)

sample_tasks (1)

_max_episode_steps (1)

set_logger (1)

set_monitor (1)

set_q_values (1)

_max_episode_seconds (1)

uncolor_board (1)

video_callable (1)

Métodos Frequentes

sample_tasks (1)

_max_episode_steps (1)

set_logger (1)

set_monitor (1)

set_q_values (1)

_max_episode_seconds (1)

uncolor_board (1)

video_callable (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: gridworld_pyro.py Projeto: sjoshi804/CS-267A-Final-Project

class Environment_gym: def __init__(self): # Build an environment # Create and record episode - remove Monitor statement if recording not desired self.env = Monitor( gym.make('one-stationary-evader-v0'), './tmp/pursuit_evasion_infer_pursuer_vs_stationary_evader', force=True) def reset(self): # Reset agent state to top-left grid corner #Reset state self.state = self.env.reset() #Initialize Agent Parameters #Get observed state space self.observed_state_space = self.env.get_observed_state_space() #Set initial state distribution self.initial_state_dist = [] self.initial_state = self.env.get_initial_state() for self.state in self.observed_state_space: if self.state == self.initial_state: self.initial_state_dist.append(1) else: self.initial_state_dist.append(0) return self.state

Exemplo n.º 2

0

Exibir arquivo

Arquivo: agent_dice.py Projeto: sjoshi804/CS-267A-Final-Project

def main(argv=()): del argv # Unused. # Build an environment # Create and record episode - remove Monitor statement if recording not desired env = Monitor(gym.make('one-random-evader-v0'), './tmp/pursuit_evasion_infer_pursuer_vs_random_evader', force=True) #Reset state state = env.reset() #Initialize Agent Parameters #Get observed state space observed_state_space = env.get_observed_state_space() #Set initial state distribution initial_state_dist = [] initial_state = env.get_initial_state() for state in observed_state_space: if state == initial_state: initial_state_dist.append(1) else: initial_state_dist.append(0) #Get action space action_space = range(0, env.action_space.n) #Set action prior to uniform dist action_prior = [] for action in action_space: action_prior.append(1/len(action_space)) #Get reward function reward_function = env.get_reward_function() #Get transition function transition_function = env.get_transition_function() #Set max trajectory length max_trajectory_length = 11 #needs to be greater than shortest distance to evader for any meaningful inference #Create Agent agent = infer.DiceInferenceEngine(observed_state_space, action_space, initial_state_dist, action_prior, reward_function, transition_function, max_trajectory_length) print("\nAgent created.\n") #Set current observed state to initial state uncolored_obs = initial_state #Initialize actions list actions = [] print("\nInfering action " + str(0) + "\n") actions.append(dist.Categorical(torch.tensor(agent.next(uncolored_obs))).sample().item()) #Game Loop for t in range(0, 11): #Render env.render() #Delay to make video easier to watch #sleep(5) #Take action and get observations, rewards, termination from environment observation, reward, done, info = env.step(actions[t]) #If termination signal received, break out of loop if done: break #Pick next action based on agent's reasoning uncolored_obs = env.uncolor_board(observation) print("\nInfering action " + str(t + 1) + "\n") actions.append(dist.Categorical(torch.tensor(agent.next(uncolored_obs))).sample().item()) env.close()

Exemplo n.º 3

0

Exibir arquivo

Arquivo: gridworld_pyro.py Projeto: sjoshi804/CS-267A-Final-Project

# Build an environment # Create and record episode - remove Monitor statement if recording not desired env = Monitor(gym.make('one-stationary-evader-v0'), './tmp/pursuit_evasion_infer_pursuer_vs_stationary_evader', force=True) #Reset state state_gym = env.reset() #Initialize Agent Parameters #Get observed state space observed_state_space = env.get_observed_state_space() #Set initial state distribution initial_state_dist = [] initial_state = env.get_initial_state() for state in observed_state_space: if state == initial_state: initial_state_dist.append(1) else: initial_state_dist.append(0) #Get action space action_space = range(0, env.action_space.n) #Set action prior to uniform dist action_prior = [] for action in action_space: action_prior.append(1 / len(action_space)) #Get reward function reward_function = env.get_reward_function() #Get transition function transition_function = env.get_transition_function()