Python TFPolicy.get_weights примеры использования

Язык программирования: Python

Пространство имен/Пакет: mlagents.trainers.tf_policy

Класс/Тип: TFPolicy

Метод/Функция: get_weights

Примеров на hotexamples.com: 3

Python TFPolicy.get_weights - 3 примера найдено. Это лучшие примеры Python кода для mlagents.trainers.tf_policy.TFPolicy.get_weights, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

TFPolicy(6)

get_action(6)

evaluate(4)

create_tf_graph(3)

get_current_step(3)

get_weights(3)

init_load_weights(2)

save_memories(2)

Пример #1

Показать файл

Файл: trainer.py Проект: donachys/ml-agents

 def _save_snapshot(self, policy: TFPolicy) -> None:
     weights = policy.get_weights()
     try:
         self.policy_snapshots[self.snapshot_counter] = weights
     except IndexError:
         self.policy_snapshots.append(weights)
     self.policy_elos[self.snapshot_counter] = self.current_elo
     self.snapshot_counter = (self.snapshot_counter + 1) % self.window

Пример #2

Показать файл

    def add_policy(self, name_behavior_id: str, policy: TFPolicy) -> None:
        # for saving/swapping snapshots
        policy.init_load_weights()
        self.policies[name_behavior_id] = policy

        # First policy encountered
        if not self.learning_behavior_name:
            weights = policy.get_weights()
            self.current_policy_snapshot = weights
            self._save_snapshot(policy)
            self.trainer.add_policy(name_behavior_id, policy)
            self.learning_behavior_name = name_behavior_id

Пример #3

Показать файл

Файл: trainer.py Проект: donachys/ml-agents

    def add_policy(self, name_behavior_id: str, policy: TFPolicy) -> None:
        """
        Adds policy to trainer. For the first policy added, add a trainer
        to the policy and set the learning behavior name to name_behavior_id.
        :param name_behavior_id: Behavior ID that the policy should belong to.
        :param policy: Policy to associate with name_behavior_id.
        """
        self.policies[name_behavior_id] = policy
        policy.create_tf_graph()

        # First policy encountered
        if not self.learning_behavior_name:
            weights = policy.get_weights()
            self.current_policy_snapshot = weights
            self.trainer.add_policy(name_behavior_id, policy)
            self._save_snapshot(policy)  # Need to save after trainer initializes policy
            self.learning_behavior_name = name_behavior_id
        else:
            # for saving/swapping snapshots
            policy.init_load_weights()