Python TorchPPOOptimizer примеры использования

Язык программирования: Python

Пространство имен/Пакет: mlagents.trainers.ppo.optimizer_torch

Класс/Тип: TorchPPOOptimizer

Примеров на hotexamples.com: 3

Python TorchPPOOptimizer - 3 примера найдено. Это лучшие примеры Python кода для mlagents.trainers.ppo.optimizer_torch.TorchPPOOptimizer, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

TorchPPOOptimizer(3)

Основные методы

TorchPPOOptimizer (3)

Пример #1

Показать файл

Файл: trainer.py Проект: ssshammi/ml-agents

 def create_ppo_optimizer(self) -> PPOOptimizer:
     if self.framework == FrameworkType.PYTORCH:
         return TorchPPOOptimizer(  # type: ignore
             cast(TorchPolicy, self.policy), self.trainer_settings  # type: ignore
         )  # type: ignore
     else:
         return PPOOptimizer(  # type: ignore
             cast(TFPolicy, self.policy), self.trainer_settings  # type: ignore
         )  # type: ignore

Пример #2

Показать файл

def create_test_ppo_optimizer(dummy_config, use_rnn, use_discrete, use_visual):
    mock_specs = mb.setup_test_behavior_specs(
        use_discrete,
        use_visual,
        vector_action_space=DISCRETE_ACTION_SPACE
        if use_discrete else VECTOR_ACTION_SPACE,
        vector_obs_space=VECTOR_OBS_SPACE,
    )

    trainer_settings = attr.evolve(dummy_config)
    trainer_settings.network_settings.memory = (NetworkSettings.MemorySettings(
        sequence_length=16, memory_size=10) if use_rnn else None)
    policy = TorchPolicy(0, mock_specs, trainer_settings, "test", False)
    optimizer = TorchPPOOptimizer(policy, trainer_settings)
    return optimizer

Пример #3

Показать файл

Файл: trainer.py Проект: vogulcan/ml-agents

 def create_ppo_optimizer(self) -> TorchPPOOptimizer:
     return TorchPPOOptimizer(  # type: ignore
         cast(TorchPolicy, self.policy), self.trainer_settings  # type: ignore
     )  # type: ignore