Ejemplos de MDP.get_parked en Python

Lenguaje de programación: Python

Namespace/Package Name: MDP

Clase / Tipo: MDP

Método / Función: get_parked

Ejemplos en hotexamples.com: 3

Python MDP.get_parked - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de MDP.MDP.get_parked extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

MDP(30)

getRewards(12)

probNextStates(12)

add_state(5)

get_action(5)

num_states(4)

get_action_list(4)

get_state_list(4)

__init__(3)

value_iteration(3)

reset(3)

get_parked(3)

get_Q_policy(3)

allStates(2)

num_actions(2)

numStates(2)

numActions(2)

initMDP(2)

get_available(2)

get_handicapped(2)

startState(2)

endStates(2)

gamma(2)

randomWalkSamples(1)

add_action(1)

valueIteration(1)

update_reward_only(1)

randomAction(1)

update_info(1)

representValues(1)

solve(1)

transform(1)

set_policy(1)

show(1)

train(1)

printAns(1)

take_action(1)

printResult(1)

buildMDP(1)

policyIteration(1)

apply_action_on_grid(1)

calc_rewards(1)

computePolicy(1)

environment(1)

getOptimalPolicy(1)

getOptimalValues(1)

build(1)

get_actions(1)

policyEvaluation(1)

get_reward(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: Simulator.py Proyecto: hillst/CS533_proj5

def run_simulation(MDP, policy):
    print "Starting simulation for given MDP"

    while MDP.get_parked() == False:
        action = policy.choose_action(MDP.get_time())
        print "[TIME", MDP.get_time() ,"]:", policy.get_name(), "chose action", action
        MDP.take_action(action)
        print "[TIME", MDP.get_time() ,"]: Moved to state", MDP.get_state(), "Current reward %.3f." % MDP.get_reward()
    print "Exited in (spot, handicapped, available):", MDP.get_spot(), MDP.get_handicapped(), MDP.get_available()

Ejemplo n.º 2

Mostrar archivo

Archivo: Simulator.py Proyecto: hillst/CS533_proj4

def run_training(MDP, policy, horizon):
    t = 0
    trajectory = []
    while t < horizon:
        if MDP.get_parked():
            # we need to make it do one more update.
            action = policy.choose_training_action()
            state = MDP.get_state()
            trajectory.append((state, action, MDP.get_state()))
            #reset our simulator
            MDP.reset()
            policy.q_updates(trajectory)
            trajectory = []
        else:
            #record trajectory
            action = policy.choose_training_action()
            state = MDP.get_state()
            policy.take_action(action)
            trajectory.append((state, action, MDP.get_state()))
        t += 1

Ejemplo n.º 3

Mostrar archivo

Archivo: Simulator.py Proyecto: hillst/CS533_proj4

def run_simulation(MDP, policy):
    #print "Starting simulation for given MDP"
    while not MDP.get_parked():
        action = policy.choose_action(MDP.get_time())
        #print "[TIME", MDP.get_time() ,"]:", policy.get_name(), "chose action", action
        policy.take_action(action)