Python QLearner.execute примеры использования

Язык программирования: Python

Пространство имен/Пакет: qlearner

Класс/Тип: QLearner

Метод/Функция: execute

Примеров на hotexamples.com: 3

Python QLearner.execute - 3 примера найдено. Это лучшие примеры Python кода для qlearner.QLearner.execute, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

QLearner(11)

execute(3)

set_r_value(3)

get_policy(3)

train(2)

move(2)

query(1)

retrain(1)

rollout(1)

run_learning_trial(1)

run_simulation_trial(1)

Q(1)

s(1)

save_model(1)

set_initial_state(1)

set_invalid(1)

test(1)

train_step(1)

update(1)

save(1)

load_maze(1)

next_state(1)

compute_action(1)

a(1)

add_tensorboard_ops(1)

animate(1)

choose_best_action(1)

clear(1)

clear_states(1)

display_Q(1)

guide(1)

display_R(1)

episodes(1)

get_action(1)

get_reward(1)

get_states(1)

goal(1)

update_target_network(1)

Пример #1

Показать файл

Файл: fulltransform.py Проект: anthonytw/transformed-qlearner

 def learn_policy(self):
     # Initialize Q-learner.
     qlearner = QLearner( \
         self.state_space,
         self.actions,
         self.handle_action,
         self.reset_training_world )
     
     # Initialize goal states.
     goal_states = []
     print "Enumerating goal states..."
     print self.state_space_dim
     for state_index in xrange(qlearner.r_table.size):
         state = numpy.unravel_index(state_index, qlearner.r_table.shape)
         if state[FullTransform.StateOffset.Arrows] == World.ArrowState.Arrows_Complete:
             goal_states.append(tuple(state))
     print "Goal states: %d" % len(goal_states)
     
     for goal_state in goal_states:
         qlearner.set_r_value( goal_state, 100 )
     
     #print qlearner.r_table
     
     # Run Q-learner.
     print "Total states: %d" % (qlearner.r_table.size)
     qlearner.execute(goal_states, 500000, 50)
     
     # Return policy.
     return qlearner.get_policy()

Пример #2

Показать файл

Файл: positiontransform.py Проект: anthonytw/transformed-qlearner

    def learn_policy(self):
        # Initialize Q-learner.
        qlearner = QLearner(self.state_space, self.actions, self.handle_action, self.reset_training_world)

        # Initialize reward states.
        goal_states = [(PositionTransform.HorizontalState.At + 1, PositionTransform.VerticleState.At + 1)]
        for goal_state in goal_states:
            qlearner.set_r_value(goal_state, 100)

        # print qlearner.r_table

        # Run Q-learner.
        qlearner.execute(goal_states, 300, 50)

        # Return policy.
        return qlearner.get_policy()

Пример #3

Показать файл

Файл: mineraltransform.py Проект: anthonytw/transformed-qlearner

 def learn_policy(self):
     # Initialize Q-learner.
     qlearner = QLearner( \
         self.state_space,
         self.actions,
         self.handle_action,
         self.reset_training_world )
     
     # Initialize reward states.
     goal_states = [( self.state_space[0].index(World.SiteState.Useless), )]
     for goal_state in goal_states:
         qlearner.set_r_value( goal_state, 100 )
     
     #print qlearner.r_table
     
     # Run Q-learner.
     qlearner.execute(goal_states, 300, 30)
     
     # Return policy.
     return qlearner.get_policy()