Ejemplos de Game.available_actions en Python

Lenguaje de programación: Python

Namespace/Package Name: gamelogic.game

Clase / Tipo: Game

Método / Función: available_actions

Ejemplos en hotexamples.com: 2

Python Game.available_actions - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de gamelogic.game.Game.available_actions extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Game(4)

getBoard(3)

available_actions(2)

do_action(2)

game_over(2)

main_loop(2)

new_game(2)

score(2)

state(2)

print_state(1)

Ejemplo n.º 1

Mostrar archivo

def play_single_game():
    """Play a single game using the latest model snapshot"""
    game = Game()
    state_size = 16
    debug = True

    model = load_model(path + "/data/checkpoint")

    game.new_game()
    state = game.state()
    state = np.reshape(state, [1, state_size])
    while not game.game_over():
        # get action from highest q-value
        act_values = model.predict(state)
        if len(game.available_actions()) < 4:
            temp = game.available_actions()
            for i in range(0, 4):
                if i not in temp:
                    act_values[0][i] = -100
        #returns action with highest q-value
        action = np.argmax(act_values[0])

        reward = (game.do_action(action))**2
        next_state = game.state()
        actions_available = game.available_actions()
        if len(actions_available) == 0:
            done = True
        else:
            done = False
        next_state = np.reshape(next_state, [1, state_size])
        state = next_state
        print("Action:", ACTION_NAMES[action])
        print("Reward:", reward)
        game.print_state()

        if done:
            states = game.state()
            states = np.reshape(state, [1, state_size])
            max_value = np.amax(states[0])
            print("Score:", game.score())
            print("Max Value: " + str(2**max_value))
            print("Game over.")
            break

Ejemplo n.º 2

Mostrar archivo

    for e in range(EPISODES):
        game.new_game()
        state = game.state()
        state = np.reshape(state, [1, agent.state_size])
        while not game.game_over():
            action = agent.act(state)
            reward = (game.do_action(action))**2
            if (agent.is_max_value_reward):
                reward = 0
                temp = game.state()
                temp_reshaped = np.reshape(temp, [1, agent.state_size])
                temp_max_value = np.amax(temp_reshaped[0])
                if temp_max_value > agent.max_value_reward_threshold:
                    reward = agent.max_value_reward_amount
            next_state = game.state()
            actions_available = game.available_actions()
            if len(actions_available) == 0:
                done = True
            else:
                done = False
            next_state = np.reshape(next_state, [1, agent.state_size])
            agent.remember(state, action, reward, next_state, done)
            state = next_state

            if done:
                if (debug): print("no action available")
                states = game.state()
                states = np.reshape(state, [1, agent.state_size])
                max_value = np.amax(states[0])
                output_list.append([
                    e,