Python CatchBall.reset примеры использования

Язык программирования: Python

Пространство имен/Пакет: catch_ball

Класс/Тип: CatchBall

Метод/Функция: reset

Примеров на hotexamples.com: 3

Python CatchBall.reset - 3 примера найдено. Это лучшие примеры Python кода для catch_ball.CatchBall.reset, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

CatchBall(5)

observe(4)

is_playable(2)

reset(2)

get_hand_number(1)

get_stone_reward(1)

is_available(1)

learning_next(1)

learning_play(1)

execute_action(1)

observe_ng(1)

print_board(1)

reset_board_status(1)

run(1)

set_card(1)

set_new_game(1)

set_question(1)

Пример #1

Показать файл

    # parameters
    n_epochs = 10000

    # environment, agent
    env = CatchBall(n_rows, n_cols, n_playerlength)
    agent = DQNAgent(env.enable_actions, env.name, env.screen_n_rows, env.screen_n_cols, env.player_length)

    # variables
    win = 0

    for e in range(n_epochs):
        # reset
        frame = 0
        loss = 0.0
        Q_max = 0.0
        env.reset(keepPos=True)
        state_t_1, reward_t, terminal = env.observe()

        while not terminal:
            state_t = state_t_1

            # execute action in environment
            action_t = agent.select_action(state_t, agent.exploration)
            env.execute_action(action_t)

            # observe environment
            state_t_1, reward_t, terminal = env.observe()

            # store experience
            agent.store_experience(state_t, action_t, reward_t, state_t_1, terminal)

Пример #2

Показать файл

Файл: train.py Проект: maekawatoshiki/dqn-sample

    # parameters
    n_epochs = 1000

    # environment, agent
    env = CatchBall()
    agent = DQNAgent(env.enable_actions, env.name)

    # variables
    win = 0

    for e in range(n_epochs):
        # reset
        frame = 0
        loss = 0.0
        Q_max = 0.0
        env.reset()
        state_t_1, reward_t, terminal = env.observe()

        while not terminal:
            state_t = state_t_1

            # execute action in environment
            action_t = agent.select_action(state_t, agent.exploration)
            env.execute_action(action_t)

            # observe environment
            state_t_1, reward_t, terminal = env.observe()

            # store experience
            agent.store_experience(state_t, action_t, reward_t, state_t_1,
                                   terminal)

Пример #3

Показать файл

Файл: train.py Проект: Tonyan/tf-dqn-simple

    # parameters
    n_epochs = 1000

    # environment, agent
    env = CatchBall()
    agent = DQNAgent(env.enable_actions, env.name)

    # variables
    win = 0

    for e in range(n_epochs):
        # reset
        frame = 0
        loss = 0.0
        Q_max = 0.0
        env.reset()
        state_t_1, reward_t, terminal = env.observe()

        while not terminal:
            state_t = state_t_1

            # execute action in environment
            action_t = agent.select_action(state_t, agent.exploration)
            env.execute_action(action_t)

            # observe environment
            state_t_1, reward_t, terminal = env.observe()

            # store experience
            agent.store_experience(state_t, action_t, reward_t, state_t_1, terminal)