Ejemplos de TicTacToe.get_initial_state en Python

Lenguaje de programación: Python

Namespace/Package Name: games.tictactoe

Clase / Tipo: TicTacToe

Método / Función: get_initial_state

Ejemplos en hotexamples.com: 2

Python TicTacToe.get_initial_state - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de games.tictactoe.TicTacToe.get_initial_state extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

TicTacToe(13)

count_lines(3)

get_initial_state(2)

available_moves(1)

check_move_validity(1)

get_possible_next_steps(1)

get_state(1)

make_move(1)

print_board(1)

print_brd(1)

print_grid(1)

print_move_grid(1)

take_action(1)

update(1)

winner(1)

Ejemplo n.º 1

Mostrar archivo

    def test_priornet_tictactoe_self_play(self):
        ttt = TicTacToe()
        nn = NeuralNetwork(ttt, PriorNet)

        t = Trainer(ttt, nn, num_simulations=2, num_games=1, num_updates=0, buffer_size_limit=None, cpuct=1, num_threads=4)
        data = t.self_play(temperature=0)

        np.testing.assert_equal(data[:,-1], np.array([1, -1, 1, -1, 1, -1, 1]))
        s = ttt.get_initial_state()
        np.testing.assert_equal(data[0,0], s)
        np.testing.assert_equal(data[0,1], np.array([0, 1, 0, 0, 0, 0, 0, 0, 0]))
        s = ttt.take_action(s, np.array([[0,1,0],[0,0,0],[0,0,0]])) # Top-middle X
        np.testing.assert_equal(data[1,0], s) 
        np.testing.assert_equal(data[1,1], np.array([1, 0, 0, 0, 0, 0, 0, 0]))
        s = ttt.take_action(s, np.array([[1,0,0],[0,0,0],[0,0,0]])) # Top-left O
        np.testing.assert_equal(data[2,0], s)
        np.testing.assert_equal(data[2,1], np.array([1, 0, 0, 0, 0, 0, 0]))
        s = ttt.take_action(s, np.array([[0,0,1],[0,0,0],[0,0,0]])) # Top-right X
        np.testing.assert_equal(data[3,0], s)
        np.testing.assert_equal(data[3,1], np.array([1, 0, 0, 0, 0, 0]))
        s = ttt.take_action(s, np.array([[0,0,0],[1,0,0],[0,0,0]])) # Mid-left O
        np.testing.assert_equal(data[4,0], s)
        np.testing.assert_equal(data[4,1], np.array([1, 0, 0, 0, 0]))
        s = ttt.take_action(s, np.array([[0,0,0],[0,1,0],[0,0,0]])) # Mid-mid X
        np.testing.assert_equal(data[5,0], s)
        np.testing.assert_equal(data[5,1], np.array([1, 0, 0, 0]))
        s = ttt.take_action(s, np.array([[0,0,0],[0,0,1],[0,0,0]])) # Mid-right O
        np.testing.assert_equal(data[6,0], s)
        np.testing.assert_equal(data[6,1], np.array([1, 0, 0]))

Ejemplo n.º 2

Mostrar archivo

 def test_policy_iteration(self):
     ttt = TicTacToe()
     nn = NeuralNetwork(ttt, PriorNet)
     t = Trainer(ttt, nn, num_simulations=2, num_games=100, num_updates=0, buffer_size_limit=None, cpuct=1, num_threads=4)
     t.policy_iteration()
     states = t.training_data[:,0]
     inits = 0
     for s in states:
         if (s.astype(np.float32) == ttt.get_initial_state()).all():
             inits += 1
     self.assertEqual(inits, 100)