Python GridWorld.get_number_of_states Examples

Programming Language: Python

Namespace/Package Name: GridWorld

Class/Type: GridWorld

Method/Function: get_number_of_states

Examples at hotexamples.com: 1

Python GridWorld.get_number_of_states - 1 examples found. These are the top rated real world Python examples of GridWorld.GridWorld.get_number_of_states extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

GridWorld(30)

move(4)

bestMove(4)

reset(4)

printValueGrid(4)

printReturnGrid(4)

printPolicyGrid(4)

possibleMoves(4)

gameOver(3)

scan_grid_and_generate_graph(2)

save_graph(2)

render(2)

print_graph(2)

setDiscountFactor(2)

after(2)

createSquareCount(2)

create_grid_ui(2)

getActions(1)

printQValues(1)

move_on_given_route_aco(1)

move_on_given_route_genetic(1)

players(1)

get(1)

printPolicy(1)

generateWalls(1)

dfs_route(1)

generateGoals(1)

move_on_given_route(1)

printValues(1)

print_map(1)

randomAction(1)

cells(1)

addRandomObstacles(1)

move_on_given_route_a_star(1)

getAccessibleCells(1)

getAgentPose(1)

get_next_state(1)

getLength(1)

getPoseFromAction(1)

getPredFromPose(1)

getState(1)

getStateSpace(1)

getTotalSteps(1)

get_grid_world(1)

get_number_of_actions(1)

make_grid_world(1)

get_number_of_states(1)

get_rewards(1)

addAgent(1)

gridDefine(1)

Example #1

Show file

File: runme.py Project: dotd/RL_python

__author__ = 'dot'

from GridWorld import GridWorld
from QAgent import QAgent
import numpy as np
import matplotlib.pyplot as plt

##
env = GridWorld(size=10)
q_agent = QAgent(env.get_number_of_states(), GridWorld.get_number_of_actions())
res = []
for idx_epoch in range(400):
    s, r, d, info = env.reset()
    print("Reset:st=%d,r=%f,d=%d,%s" % (s, r, d, str(info)))
    for t in range(100):
        # env.render()
        curAction = q_agent.get_action_epsilon_greedy(env.get_state())
        # print("State=%d,Action=%d"%(env.getState(),curAction))
        nxtSt, nxtR, done, info = env.step(curAction)
        # print("nxtSt=%d,nxtR=%f,d=%d,info=%s"%(nxtSt,nxtR,done,str(info)))
        q_agent.update(curAction, nxtSt, nxtR)
        if done:
            print("Episode %d finished after %d time steps" %
                  (idx_epoch, t + 1))
            #print(q_agent.show_q())
            print("=============")
            res.append(t + 1)
            break

print("p1")