Exemplos de GridWorld.is_visited em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: GridWorld

Classe / Tipo: GridWorld

Método / Função: is_visited

Exemplos em hotexamples.com: 1

GridWorld.is_visited em Python - 1 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de GridWorld.GridWorld.is_visited em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

GridWorld(30)

move(4)

bestMove(4)

reset(4)

printValueGrid(4)

printReturnGrid(4)

printPolicyGrid(4)

possibleMoves(4)

gameOver(3)

scan_grid_and_generate_graph(2)

save_graph(2)

render(2)

print_graph(2)

setDiscountFactor(2)

after(2)

createSquareCount(2)

create_grid_ui(2)

getActions(1)

printQValues(1)

move_on_given_route_aco(1)

move_on_given_route_genetic(1)

players(1)

get(1)

printPolicy(1)

generateWalls(1)

dfs_route(1)

generateGoals(1)

move_on_given_route(1)

printValues(1)

print_map(1)

randomAction(1)

cells(1)

addRandomObstacles(1)

move_on_given_route_a_star(1)

getAccessibleCells(1)

getAgentPose(1)

get_next_state(1)

getLength(1)

getPoseFromAction(1)

getPredFromPose(1)

getState(1)

getStateSpace(1)

getTotalSteps(1)

get_grid_world(1)

get_number_of_actions(1)

make_grid_world(1)

get_number_of_states(1)

get_rewards(1)

addAgent(1)

gridDefine(1)

Métodos Frequentes

GridWorld (30)

move (4)

bestMove (4)

reset (4)

printValueGrid (4)

printReturnGrid (4)

printPolicyGrid (4)

possibleMoves (4)

gameOver (3)

scan_grid_and_generate_graph (2)

Métodos Frequentes

save_graph (2)

render (2)

print_graph (2)

setDiscountFactor (2)

after (2)

createSquareCount (2)

create_grid_ui (2)

getActions (1)

printQValues (1)

move_on_given_route_aco (1)

move_on_given_route_genetic (1)

players (1)

get (1)

printPolicy (1)

generateWalls (1)

dfs_route (1)

generateGoals (1)

move_on_given_route (1)

printValues (1)

print_map (1)

Métodos Frequentes

move_on_given_route_genetic (1)

players (1)

get (1)

printPolicy (1)

generateWalls (1)

dfs_route (1)

generateGoals (1)

move_on_given_route (1)

printValues (1)

print_map (1)

randomAction (1)

cells (1)

addRandomObstacles (1)

move_on_given_route_a_star (1)

getAccessibleCells (1)

getAgentPose (1)

get_next_state (1)

getLength (1)

getPoseFromAction (1)

getPredFromPose (1)

getState (1)

getStateSpace (1)

getTotalSteps (1)

get_grid_world (1)

get_number_of_actions (1)

make_grid_world (1)

get_number_of_states (1)

get_rewards (1)

addAgent (1)

gridDefine (1)

Métodos Frequentes

randomAction (1)

cells (1)

addRandomObstacles (1)

move_on_given_route_a_star (1)

getAccessibleCells (1)

getAgentPose (1)

get_next_state (1)

getLength (1)

getPoseFromAction (1)

getPredFromPose (1)

getState (1)

getStateSpace (1)

getTotalSteps (1)

get_grid_world (1)

get_number_of_actions (1)

make_grid_world (1)

get_number_of_states (1)

get_rewards (1)

addAgent (1)

gridDefine (1)

isOutsideBounds (1)

is_terminated_state (1)

is_visited (1)

mainloop (1)

get_state (1)

Exemplo n.º 1

0

Exibir arquivo

Functions.create_random_obstacles(grid_world, 0.105) grid_world.scan_grid_and_generate_graph() grid_world.print_graph() grid_world.create_grid_ui(grid_world.m, grid_world.n, (grid_world.start_x, grid_world.start_y), (grid_world.end_x, grid_world.end_y), grid_world.obstacles) SA = SARSAgent(list(range(4))) scores, episodes = [], [] number_of_episodes = 1000 for episode in range(number_of_episodes): score = 0 state = grid_world.reset() grid_world.is_visited = [[0] * grid_world.m for temp in range(grid_world.n)] while True: grid_world.render() action = SA.get_action(str(state)) next_state, reward, done = grid_world.step(action) next_action = SA.get_action(str(next_state)) SA.learn(str(state), action, reward, str(next_state), next_action) print("<state:{0} , action:{1} , reward:{2} , next_state:{3}>". format(str(state), str(action), str(reward), str(next_state))) # grid_world.is_visited[state[0]][state[1]] += 1 state = next_state action = next_action score += reward