Python Env.get_payoffsの例

プログラミング言語: Python

名前空間/パッケージ名: rlcard.envs

クラス/型: Env

メソッド/関数: get_payoffs

hotexamples.comのコード掲載数: 2

Python Env.get_payoffs - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのrlcard.envs.Env.get_payoffsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

get_player_id(6)

step(5)

is_over(4)

get_payoffs(2)

get_state(1)

コード例 #1

ファイルを表示

 def default_policy(self, node: MPMCTSTreeNode, env: Env):
     if env.is_over():
         return env.get_payoffs()
     player_id = env.get_player_id()
     #print(player_id)
     action = random.sample(node.legal_actions[player_id], 1)[0]
     while not env.is_over():
         # step forward
         next_state, next_player_id = env.step(action, False)
         if not env.is_over():
             action = random.sample(next_state['legal_actions'], 1)[0]
     # game over
     return env.get_payoffs()

コード例 #2

ファイルを表示

    def default_policy(self, node: MPMCTSTreeNode, env: Env):
        if env.is_over():
            return env.get_payoffs()
        player_id = env.get_player_id()
        #print(player_id)
        state = env.get_state(player_id)

        action, _ = self.drqn_agents[player_id].eval_step(state)
        while not env.is_over():
            #print(action)
            # step forward
            next_state, next_player_id = env.step(action, False)

            if not env.is_over():
                #action = random.sample(next_state['legal_actions'],1)[0]
                action, _ = self.drqn_agents[next_player_id].eval_step(
                    next_state)
        # game over
        return env.get_payoffs()