Python Grid.get_example_state Exemples

Langage de programmation: Python

Espace de nommage/Pack: src.Grid

Class/Type: Grid

Méthode/Fonction: get_example_state

Exemples au hotexamples.com: 1

Python Grid.get_example_state - 1 exemples trouvés. Ce sont les exemples réels les mieux notés de src.Grid.Grid.get_example_state extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Grid(11)

get_mines_surronding_squares(3)

checkEmpty(1)

display(1)

getCountsInCell(1)

getMeanDataInCell(1)

get_example_state(1)

initializeGrid(1)

pad_grid(1)

setBoat(1)

setValidCells(1)

solve(1)

Méthodes fréquemment utilisées

Grid (11)

get_mines_surronding_squares (3)

checkEmpty (1)

display (1)

getCountsInCell (1)

getMeanDataInCell (1)

get_example_state (1)

initializeGrid (1)

pad_grid (1)

setBoat (1)

Méthodes fréquemment utilisées

setValidCells (1)

solve (1)

Exemple #1

0

Afficher le fichier

class Environment(BaseEnvironment): def __init__(self, params: EnvironmentParams): self.display = DHDisplay() super().__init__(params, self.display) self.grid = Grid(params.grid_params, stats=self.stats) self.rewards = Rewards(params.reward_params, stats=self.stats) self.physics = Physics(params=params.physics_params, stats=self.stats) self.agent = DDQNAgent(params.agent_params, self.grid.get_example_state(), self.physics.get_example_action(), stats=self.stats) self.trainer = DDQNTrainer(params.trainer_params, agent=self.agent) self.display.set_channel(self.physics.channel) self.first_action = True self.last_actions = [] self.last_rewards = [] self.last_states = [] def test_episode(self): state = copy.deepcopy(self.init_episode()) self.stats.on_episode_begin(self.episode_count) first_action = True while not state.all_terminal: for state.active_agent in range(state.num_agents): if state.terminal: continue action = self.agent.get_exploitation_action_target(state) if not first_action: reward = self.rewards.calculate_reward( self.last_states[state.active_agent], GridActions(self.last_actions[state.active_agent]), state) self.stats.add_experience( (self.last_states[state.active_agent], self.last_actions[state.active_agent], reward, copy.deepcopy(state))) self.last_states[state.active_agent] = copy.deepcopy(state) self.last_actions[state.active_agent] = action state = self.physics.step(GridActions(action)) if state.terminal: reward = self.rewards.calculate_reward( self.last_states[state.active_agent], GridActions(self.last_actions[state.active_agent]), state) self.stats.add_experience( (self.last_states[state.active_agent], self.last_actions[state.active_agent], reward, copy.deepcopy(state))) first_action = False self.stats.on_episode_end(self.episode_count) self.stats.log_testing_data(step=self.step_count) def test_scenario(self, scenario): state = copy.deepcopy(self.init_episode(scenario)) while not state.all_terminal: for state.active_agent in range(state.num_agents): if state.terminal: continue action = self.agent.get_exploitation_action_target(state) state = self.physics.step(GridActions(action)) def step(self, state: State, random=False): for state.active_agent in range(state.num_agents): if state.terminal: continue if random: action = self.agent.get_random_action() else: action = self.agent.act(state) if not self.first_action: reward = self.rewards.calculate_reward( self.last_states[state.active_agent], GridActions(self.last_actions[state.active_agent]), state) self.trainer.add_experience( self.last_states[state.active_agent], self.last_actions[state.active_agent], reward, state) self.stats.add_experience( (self.last_states[state.active_agent], self.last_actions[state.active_agent], reward, copy.deepcopy(state))) self.last_states[state.active_agent] = copy.deepcopy(state) self.last_actions[state.active_agent] = action state = self.physics.step(GridActions(action)) if state.terminal: reward = self.rewards.calculate_reward( self.last_states[state.active_agent], GridActions(self.last_actions[state.active_agent]), state) self.trainer.add_experience( self.last_states[state.active_agent], self.last_actions[state.active_agent], reward, state) self.stats.add_experience( (self.last_states[state.active_agent], self.last_actions[state.active_agent], reward, copy.deepcopy(state))) self.step_count += 1 self.first_action = False return state def init_episode(self, init_state=None): state = super().init_episode(init_state) self.last_states = [None] * state.num_agents self.last_actions = [None] * state.num_agents self.first_action = True return state