Python BaseDynaAgent.policy примеры использования

Язык программирования: Python

Пространство имен/Пакет: Agents.BaseDynaAgent

Класс/Тип: BaseDynaAgent

Метод/Функция: policy

Примеров на hotexamples.com: 2

Python BaseDynaAgent.policy - 2 примера найдено. Это лучшие примеры Python кода для Agents.BaseDynaAgent.BaseDynaAgent.policy, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

start(4)

__init__(3)

end(2)

policy(2)

step(1)

Основные методы

start (4)

__init__ (3)

end (2)

policy (2)

step (1)

Пример #1

Показать файл

Файл: DQNMCTSAgent.py Проект: kohankhaki/SearchRL

    def rollout_policy(self, state):
        # random policy
        # action = random.choice(self.action_list)

        # DQNs policy
        state = self.getStateRepresentation(state)

        action_ind = BaseDynaAgent.policy(self, state)
        action = self.action_list[action_ind.item()]

        return action

Пример #2

Показать файл

Файл: DQNMCTSAgent.py Проект: kohankhaki/SearchRL

 def policy(self, state):
     if self.episode_counter % 2 == 1:
         action, sub_tree = None, None
         for i in range(self.num_iterations):
             action, sub_tree = self.MCTS_iteration()
         # self.render_tree()
         self.subtree_node = sub_tree
         action = torch.from_numpy(np.array(
             [self.getActionIndex(action)])).unsqueeze(0).to(self.device)
     else:
         action = BaseDynaAgent.policy(self, state)
     return action