Python QLearner.get_action примеры использования

Язык программирования: Python

Пространство имен/Пакет: qlearner

Класс/Тип: QLearner

Метод/Функция: get_action

Примеров на hotexamples.com: 1

Python QLearner.get_action - 1 пример найден. Это лучшие примеры Python кода для qlearner.QLearner.get_action, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

QLearner(11)

execute(3)

set_r_value(3)

get_policy(3)

train(2)

move(2)

query(1)

retrain(1)

rollout(1)

run_learning_trial(1)

run_simulation_trial(1)

Q(1)

s(1)

save_model(1)

set_initial_state(1)

set_invalid(1)

test(1)

train_step(1)

update(1)

save(1)

load_maze(1)

next_state(1)

compute_action(1)

a(1)

add_tensorboard_ops(1)

animate(1)

choose_best_action(1)

clear(1)

clear_states(1)

display_Q(1)

guide(1)

display_R(1)

episodes(1)

get_action(1)

get_reward(1)

get_states(1)

goal(1)

update_target_network(1)

Пример #1

Показать файл

Файл: qagent_training.py Проект: SamKnightGit/HFO_Bots

                        continue

                hfo.act(MOVE)
            else:
                state, valid_teammates = state_representer.get_representation(
                    features, args.numTeammates)
                print("Valid Teammates: ", valid_teammates)
                if 0 in valid_teammates:
                    q_learner.set_invalid(state, valid_teammates)

                if action is not None:
                    reward = get_reward(status)
                    reward_printer(state, action, reward)
                    q_learner.update(state, action, reward)

                action = q_learner.get_action(state, valid_teammates)

                if action == 0:
                    print("Action Taken: DRIBBLE \n")
                    hfo.act(DRIBBLE)
                elif action == 1:
                    print("Action Taken: SHOOT \n")
                    hfo.act(SHOOT)
                elif args.numTeammates > 0:
                    print("Action Taken: PASS -> {0} \n".format(action - 2))
                    hfo.act(PASS, features[15 + 6 * (action - 2)])
            status = hfo.step()

        if action is not None and state is not None:
            reward = get_reward(status)
            reward_printer(state, action, reward)