Esempi in Python per QLearner.get_policy

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: qlearner

Classe/tipologia: QLearner

Metodo/funzione: get_policy

Esempi su hotexamples.com: 3

QLearner.get_policy in Python: 3 esempi trovati. Questi sono i migliori esempi reali in Python per qlearner.QLearner.get_policy, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

QLearner(11)

execute(3)

set_r_value(3)

get_policy(3)

train(2)

move(2)

query(1)

retrain(1)

rollout(1)

run_learning_trial(1)

run_simulation_trial(1)

Q(1)

s(1)

save_model(1)

set_initial_state(1)

set_invalid(1)

test(1)

train_step(1)

update(1)

save(1)

load_maze(1)

next_state(1)

compute_action(1)

a(1)

add_tensorboard_ops(1)

animate(1)

choose_best_action(1)

clear(1)

clear_states(1)

display_Q(1)

guide(1)

display_R(1)

episodes(1)

get_action(1)

get_reward(1)

get_states(1)

goal(1)

update_target_network(1)

Esempio n. 1

Mostra file

File: fulltransform.py Progetto: anthonytw/transformed-qlearner

 def learn_policy(self):
     # Initialize Q-learner.
     qlearner = QLearner( \
         self.state_space,
         self.actions,
         self.handle_action,
         self.reset_training_world )
     
     # Initialize goal states.
     goal_states = []
     print "Enumerating goal states..."
     print self.state_space_dim
     for state_index in xrange(qlearner.r_table.size):
         state = numpy.unravel_index(state_index, qlearner.r_table.shape)
         if state[FullTransform.StateOffset.Arrows] == World.ArrowState.Arrows_Complete:
             goal_states.append(tuple(state))
     print "Goal states: %d" % len(goal_states)
     
     for goal_state in goal_states:
         qlearner.set_r_value( goal_state, 100 )
     
     #print qlearner.r_table
     
     # Run Q-learner.
     print "Total states: %d" % (qlearner.r_table.size)
     qlearner.execute(goal_states, 500000, 50)
     
     # Return policy.
     return qlearner.get_policy()

Esempio n. 2

Mostra file

File: positiontransform.py Progetto: anthonytw/transformed-qlearner

    def learn_policy(self):
        # Initialize Q-learner.
        qlearner = QLearner(self.state_space, self.actions, self.handle_action, self.reset_training_world)

        # Initialize reward states.
        goal_states = [(PositionTransform.HorizontalState.At + 1, PositionTransform.VerticleState.At + 1)]
        for goal_state in goal_states:
            qlearner.set_r_value(goal_state, 100)

        # print qlearner.r_table

        # Run Q-learner.
        qlearner.execute(goal_states, 300, 50)

        # Return policy.
        return qlearner.get_policy()

Esempio n. 3

Mostra file

File: mineraltransform.py Progetto: anthonytw/transformed-qlearner

 def learn_policy(self):
     # Initialize Q-learner.
     qlearner = QLearner( \
         self.state_space,
         self.actions,
         self.handle_action,
         self.reset_training_world )
     
     # Initialize reward states.
     goal_states = [( self.state_space[0].index(World.SiteState.Useless), )]
     for goal_state in goal_states:
         qlearner.set_r_value( goal_state, 100 )
     
     #print qlearner.r_table
     
     # Run Q-learner.
     qlearner.execute(goal_states, 300, 30)
     
     # Return policy.
     return qlearner.get_policy()