Python MancalaEnv.get_action_mask_with_no_pieの例

プログラミング言語: Python

名前空間/パッケージ名: magent.mancala

クラス/型: MancalaEnv

メソッド/関数: get_action_mask_with_no_pie

hotexamples.comのコード掲載数: 2

Python MancalaEnv.get_action_mask_with_no_pie - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのmagent.mancala.MancalaEnv.get_action_mask_with_no_pieの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

MancalaEnv(10)

clone(7)

get_legal_moves(4)

perform_move(3)

compute_end_game_reward(2)

get_action_mask_with_no_pie(2)

is_game_over(2)

is_legal(2)

next_states(2)

get_player_utility(1)

get_winner(1)

is_legal_action(1)

make_move(1)

コード例 #1

ファイルを表示

    def evaluate_state(self, env: MancalaEnv) -> (float, float):
        flip_board = env.side_to_move == Side.NORTH
        state = env.board.get_board_image(flipped=flip_board)
        mask = env.get_action_mask_with_no_pie()
        dist, _, value = self.network.evaluate_move(state=state, mask=mask)

        return dist, float(value)

コード例 #2

ファイルを表示

 def sample_state(self, env: MancalaEnv) -> (int, float):
     flip_board = env.side_to_move == Side.NORTH
     state = env.board.get_board_image(flipped=flip_board)
     mask = env.get_action_mask_with_no_pie()
     return self.network.sample(state=state, mask=mask)