Ejemplos de BaristaNet.select_action en Python

Lenguaje de programación: Python

Namespace/Package Name: barista.baristanet

Clase / Tipo: BaristaNet

Método / Función: select_action

Ejemplos en hotexamples.com: 1

Python BaristaNet.select_action - 1 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de barista.baristanet.BaristaNet.select_action extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

BaristaNet(3)

add_dataset(2)

dummy_load_minibatch(1)

full_pass(1)

get_ipc_interface(1)

select_action(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: evaluation.py Proyecto: kjchavez/distributed-deep-q

class PolicyEvaluator(object):
    def __init__(self, architecture_file, model_file):
        # Initialize objects
        self.net = BaristaNet(architecture_file, model_file, None)
        self.batch_size = self.net.batch_size

        game = SnakeGame()
        preprocessor = generate_preprocessor(self.net.state.shape[2:],
                                             gray_scale)
        self.engines = [ExpGain(self.net, ['w', 'a', 's', 'd'],
                                preprocessor, game.cpu_play,
                                None, game.encode_state())
                        for _ in range(self.batch_size)]

    def evaluate(self, model, num_trials):
        """ Runs |num_trials| games and returns average score. """
        for eg in self.engines:
            set_net_params(eg.net.net, model)
            eg.reset_game()

        total_score = 0
        trials_completed = 0
        scores = [0] * self.batch_size
        while trials_completed < num_trials:
            states = [eg.get_preprocessed_state() for eg in self.engines]
            actions = self.net.select_action(states,
                                             batch_size=self.batch_size)
            for i, (action, eg) in enumerate(zip(actions, self.engines)):
                scores[i] += eg.play_action(eg.actions[action])
                if eg.game_over:
                    total_score += scores[i]
                    trials_completed += 1
                    if trials_completed == num_trials:
                        break
                    eg.reset_game()
                    scores[i] = 0

        return float(total_score)/num_trials