Python TicTacToeActionHelper Beispiele

Programmiersprache: Python

Namespace / Paketname: tictactoe_action_helper

Beispiele auf hotexamples.com: 8

Python TicTacToeActionHelper - 8 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die tictactoe_action_helper.TicTacToeActionHelper, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

pick_random_action(3)

get_available_actions(2)

select_winning_action(2)

state_to_string(2)

Beispiel #1

Datei anzeigen

Datei: tictactoe_algorithm_player.py Projekt: hiro-kj/tictactoe_reinforcement_learning

 def select_action(self, state):
     winning_action = TicTacToeActionHelper.select_winning_action(self.player_number, state)
     if (not (winning_action is None)):
         return winning_action
     
     defending_action = TicTacToeActionHelper.select_winning_action(self.opponent_player_number, state)
     if (not (defending_action is None)):
         return defending_action
     
     return TicTacToeActionHelper.pick_random_action(state)

Beispiel #2

Datei anzeigen

def test_state_to_string():
    state = np.array([[1, 0, 0], [0, 2, 0], [0, 0, 1]])
    state_str = TicTacToeActionHelper.state_to_string(state)
    assert state_str == "100020001"

    state = np.array([[1, 1, 2], [2, 2, 1], [1, 2, 1]])
    state_str = TicTacToeActionHelper.state_to_string(state)
    assert state_str == "112221121"

    state = np.zeros((3, 3), dtype=np.int)
    state_str = TicTacToeActionHelper.state_to_string(state)
    assert state_str == "000000000"

Beispiel #3

Datei anzeigen

def test_pick_random_action(monkeypatch):
    # make random choice always pick the middle element.
    mock_random_choice = MagicMock(side_effect= lambda x: x[(len(x) + 1) // 2 - 1] if len(x) > 0 else None)
    monkeypatch.setattr("random.choice", mock_random_choice)

    state = np.array([[1, 0, 0], [0, 2, 0], [0, 0, 0]])
    assert TicTacToeActionHelper.pick_random_action(state) == 5
    
    state = np.array([[1, 1, 2], [2, 2, 1], [2, 0, 1]])
    assert TicTacToeActionHelper.pick_random_action(state) == 7

    # no actions to pick
    state = np.array([[1, 1, 2], [2, 2, 1], [2, 1, 1]])
    assert TicTacToeActionHelper.pick_random_action(state) is None

Beispiel #4

Datei anzeigen

def test_get_available_action():
    state = np.array([[1, 0, 0], [0, 2, 0], [0, 0, 1]])
    available_actions = TicTacToeActionHelper.get_available_actions(state)
    assert available_actions == [1, 2, 3, 5, 6, 7]

    state = np.array([[0, 2, 1], [2, 0, 1], [2, 1, 0]])
    available_actions = TicTacToeActionHelper.get_available_actions(state)
    assert available_actions == [0, 4, 8]

    # none available
    state = np.array([[1, 1, 2], [2, 2, 1], [1, 2, 1]])
    available_actions = TicTacToeActionHelper.get_available_actions(state)
    assert available_actions == []

    # all available
    state = np.zeros((3, 3), dtype=np.int)
    available_actions = TicTacToeActionHelper.get_available_actions(state)
    assert available_actions == [0, 1, 2, 3, 4, 5, 6, 7, 8]

Beispiel #5

Datei anzeigen

def test_select_winning_action():
    # test rows
    state = np.array([[1, 1, 0],
                      [2, 0, 2],
                      [1, 2, 0]])
    assert TicTacToeActionHelper.select_winning_action(1, state) == 2
    assert TicTacToeActionHelper.select_winning_action(2, state) == 4

    # test columns
    state = np.array([[0, 0, 1],
                      [2, 2, 1],
                      [2, 1, 0]])
    assert TicTacToeActionHelper.select_winning_action(1, state) == 8
    assert TicTacToeActionHelper.select_winning_action(2, state) == 0

    # test diagnals
    state = np.array([[1, 2, 2],
                      [0, 1, 0],
                      [0, 0, 0]])
    assert TicTacToeActionHelper.select_winning_action(1, state) == 8

    state = np.array([[2, 0, 0],
                      [0, 1, 0],
                      [1, 0, 2]])
    assert TicTacToeActionHelper.select_winning_action(1, state) == 2

    # test no winning lines
    state = np.array([[1, 2, 1],
                      [1, 2, 2],
                      [2, 1, 1]])
    assert TicTacToeActionHelper.select_winning_action(1, state) is None
    assert TicTacToeActionHelper.select_winning_action(2, state) is None

    state = np.array([[1, 0, 0],
                      [0, 2, 0],
                      [0, 0, 0]])
    assert TicTacToeActionHelper.select_winning_action(1, state) is None
    assert TicTacToeActionHelper.select_winning_action(2, state) is None

Beispiel #6

Datei anzeigen

 def _state_to_string(self, state):
     return TicTacToeActionHelper.state_to_string(state)

Beispiel #7

Datei anzeigen

 def _get_available_actions(self, state):
     return TicTacToeActionHelper.get_available_actions(state)

Beispiel #8

Datei anzeigen

Datei: tictactoe_algorithm_player.py Projekt: hiro-kj/tictactoe_reinforcement_learning

 def select_action(self, state):
     return TicTacToeActionHelper.pick_random_action(state)