Ejemplos de GridworldEnv.state2str en Python

Lenguaje de programación: Python

Namespace/Package Name: gridworld

Clase / Tipo: GridworldEnv

Método / Función: state2str

Ejemplos en hotexamples.com: 5

Python GridworldEnv.state2str - 5 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de gridworld.GridworldEnv.state2str extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

GridworldEnv(20)

state2str(5)

reset(4)

step(3)

_render(2)

seed(2)

make_goal(1)

make_start(1)

plot_world(1)

Ejemplo n.º 1

Mostrar archivo

    def setState(self, observation):

        self.lstate = GridworldEnv.state2str(observation)

        if self.lstate not in self.Q.keys():
            self.Q[self.lstate] = np.zeros(self.nb_action)

        if random.uniform(0, 1) < self.epsilon:
            self.laction = np.random.randint(self.nb_action)

        else:
            self.laction = np.argmax([self.Q[self.lstate]])

Ejemplo n.º 2

Mostrar archivo

    def act(self, observation, reward, done):

        obs = GridworldEnv.state2str(observation)

        if obs not in self.Q.keys():
            self.Q[obs] = np.zeros(self.nb_action)

        if random.uniform(0, 1) < self.epsilon:
            self.laction = np.random.randint(self.nb_action)

        else:
            self.laction = np.argmax([self.Q[obs]])

        self._update_Qvalue(reward, obs, done)

        self.lstate = obs

        return self.laction

Ejemplo n.º 3

Mostrar archivo

    def _total_reward(self):
        """Sum of rewards expected for every state"""
        return sum(self.value[state] for state in self.mdp.keys())

        obs = GridworldEnv.state2str(observation)

        if obs in self.Q.keys():
            self.Q[obs] = np.zeros(self.nb_action)

        if random.uniform(0, 1) < self.epsilon:
            self.laction = np.random.randint(self.nb_action)

        else:
            self.laction = np.argmax([self.Q[obs]])

        self._update_Qvalue(reward, obs, done)

        self.lstate = obs

        return self.laction

Ejemplo n.º 4

Mostrar archivo

    def setState(self, observation):

        self.lstate = GridworldEnv.state2str(observation)

        if self.lstate not in self.Q.keys():
            self.Q[self.lstate] = np.zeros(self.nb_action)

Ejemplo n.º 5

Mostrar archivo

 def act(self, observation, reward, done):
     # get action for current state
     # obs = str(obs.tolist())
     obs = GridworldEnv.state2str(observation)
     action = self.policy[obs]
     return action