Esempi in Python per Maze.animate_state_values_history

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: maze

Classe/tipologia: Maze

Metodo/funzione: animate_state_values_history

Esempi su hotexamples.com: 1

Maze.animate_state_values_history in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per maze.Maze.animate_state_values_history, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Maze(30)

add_room(9)

after(6)

blit(5)

__get_rectangle_coords__(4)

__init__(4)

_apply_valid_move_constraint(4)

DFS(2)

atExit(2)

Solve(2)

add_canvas(2)

_set_start_and_end(2)

_to_str_matrix(2)

bfsPathFinder(1)

beginMaze(1)

bfs(1)

bestQ(1)

avatarCoodinate(1)

fromJSON(1)

getSize(1)

getItem(1)

getPos(1)

as_image(1)

get_reachables(1)

load_level(1)

makeMap(1)

parse(1)

pretty_print(1)

repaint(1)

setExist(1)

astarPathFinder(1)

all_edges(1)

apply(1)

add_cell(1)

Qtable(1)

__repr__(1)

__str__(1)

_color(1)

_set_borders(1)

_set_inner_walls(1)

a_star_search(1)

act(1)

add_obstical(1)

animate_state_values_history(1)

add_row(1)

add_square(1)

add_to_map(1)

advance(1)

allSolutionsDFSRec(1)

allSolutionsFoundDFS(1)

Esempio n. 1

Mostra file

File: sarsa_agent.py Progetto: snakamura/reinforcement_pytorch

    def update_q(self, q, state, action, reward, next_state, next_action, eta,
                 gamma):
        if next_state == agent.GOAL:
            q[state, action] += eta * (reward - q[state, action])
        else:
            q[state,
              action] += eta * (reward + gamma * q[next_state, next_action] -
                                q[state, action])
        return q


if __name__ == '__main__':
    [states, actions] = agent.THETA_0.shape
    q_0 = np.random.rand(states, actions) * agent.THETA_0 * 0.1
    pi_0 = agent.simple_convert_theta_to_pi(agent.THETA_0)
    eta = 0.1
    gamma = 0.9
    epsilon = 0.5

    sarsaAgent = SarsaAgent(pi_0, eta, gamma, epsilon)
    q, state_action_history, state_values_history = sarsaAgent.solve(q_0)

    print(q)
    print(state_action_history)

    maze = Maze(plt, agent.WIDTH, agent.HEIGHT, agent.WALLS, agent.START,
                agent.GOAL)
    #    anim = maze.animate_state_history([s for s, a in state_action_history])
    anim = maze.animate_state_values_history(state_values_history)
    plt.show()