Python BaseDynaAgentの例

プログラミング言語: Python

名前空間/パッケージ名: Agents.BaseDynaAgent

クラス/型: BaseDynaAgent

hotexamples.comのコード掲載数: 11

Python BaseDynaAgent - 11件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのAgents.BaseDynaAgent.BaseDynaAgentの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

start(4)

__init__(3)

end(2)

policy(2)

step(1)

よく使われるメソッド

end (2)

コード例 #1

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

 def __init__(self, params={}):
     BaseDynaAgent.__init__(self, params)
     MCTSAgent.__init__(self, params)
     self.episode_counter = -1
     self.td_average = 0
     self.average_rate = 0.1
     self.mcts_count = 0

コード例 #2

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

 def end(self, reward):
     if self.episode_counter < episodes_only_dqn:
         BaseDynaAgent.end(self, reward)
     elif self.episode_counter < episodes_only_dqn + episodes_only_mcts:
         MCTSAgent.end(self, reward)
     else:
         if self.episode_counter % 2 == 0:
             BaseDynaAgent.end(self, reward)
         else:
             MCTSAgent.end(self, reward)

コード例 #3

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

 def step(self, reward, observation):
     if self.episode_counter < episodes_only_dqn:
         action = BaseDynaAgent.step(self, reward, observation)
     elif self.episode_counter < episodes_only_dqn + episodes_only_mcts:
         action = MCTSAgent.step(self, reward, observation)
     else:
         if self.episode_counter % 2 == 0:
             action = BaseDynaAgent.step(self, reward, observation)
         else:
             action = MCTSAgent.step(self, reward, observation)
     return action

コード例 #4

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

 def start(self, observation):
     self.episode_counter += 1
     if self.episode_counter % 2 == 0:
         action = BaseDynaAgent.start(self, observation)
     else:
         action = MCTSAgent.start(self, observation)
     return action

コード例 #5

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

 def start(self, observation):
     self.episode_counter += 1
     if self.episode_counter % 2 == 0:
         action = BaseDynaAgent.start(self, observation)
     else:
         action = MCTSAgent.start(self, observation)
         self.mcts_prev_state = self.getStateRepresentation(observation)
         self.mcts_prev_action = action
     return action

コード例 #6

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

    def rollout_policy(self, state):
        # random policy
        # action = random.choice(self.action_list)

        # DQNs policy
        state = self.getStateRepresentation(state)

        action_ind = BaseDynaAgent.policy(self, state)
        action = self.action_list[action_ind.item()]

        return action

コード例 #7

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

 def policy(self, state):
     if self.episode_counter % 2 == 1:
         action, sub_tree = None, None
         for i in range(self.num_iterations):
             action, sub_tree = self.MCTS_iteration()
         # self.render_tree()
         self.subtree_node = sub_tree
         action = torch.from_numpy(np.array(
             [self.getActionIndex(action)])).unsqueeze(0).to(self.device)
     else:
         action = BaseDynaAgent.policy(self, state)
     return action

コード例 #8

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

    def start(self, observation):
        self.episode_counter += 1
        if self.keep_tree and self.root is None:
            self.root = Node(None, observation)
            self.expansion(self.root)

        if self.keep_tree:
            self.subtree_node = self.root
        else:
            self.subtree_node = Node(None, observation)
            self.expansion(self.subtree_node)

        action = BaseDynaAgent.start(self, observation)
        return action

コード例 #9

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

 def end(self, reward):
     BaseDynaAgent.end(self, reward)

コード例 #10

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

 def __init__(self, params={}):
     BaseDynaAgent.__init__(self, params)
     MCTSAgent.__init__(self, params)
     self.episode_counter = -1

コード例 #11

0

ファイルを表示

ファイル: DQNMCTSAgent.py プロジェクト: kohankhaki/SearchRL

 def __init__(self, params={}):
     BaseDynaAgent.__init__(self, params)
     MCTSAgent.__init__(self, params)
     with open("dqn_vf_4by4.p", 'rb') as file:
         self._vf = pickle.load(file)
     self.episode_counter = -1