Python StochasticPolicy примеры использования

Язык программирования: Python

Пространство имен/Пакет: agents.maze_agents.modules

Класс/Тип: StochasticPolicy

Примеров на hotexamples.com: 6

Python StochasticPolicy - 6 примеров найдено. Это лучшие примеры Python кода для agents.maze_agents.modules.StochasticPolicy, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

StochasticPolicy(6)

Основные методы

StochasticPolicy (6)

Пример #1

Показать файл

    def _make_agent_modules(self):
        self.policy = StochasticPolicy(self._dummy_env,
                                       256,
                                       a_range=5,
                                       action_size=self._dummy_env.goal_size)
        self.v_module = Value(self._dummy_env, 256, use_antigoal=False)

        self.policy_lo = StochasticPolicy(self._dummy_env, 256)
        self.v_module_lo = Value(self._dummy_env, 256, use_antigoal=False)

Пример #2

Показать файл

 def _make_agent_modules(self):
     self.vae = VQVAEDiscriminator(state_size=self._dummy_env.state_size, **self.vae_args)
     self.vae.load_checkpoint(self.vae_checkpoint_path)
     kwargs = dict(env=self._dummy_env, hidden_size=self.hidden_size, num_layers=self.num_layers,
                   goal_size=self.vae.code_size, normalize_inputs=self.normalize_inputs)
     self.policy = StochasticPolicy(**kwargs)
     self.v_module = Value(use_antigoal=self.use_antigoal, **kwargs)

Пример #3

Показать файл

 def _make_agent_modules(self):
     self._make_skill_embedding()
     kwargs = dict(env=self._dummy_env,
                   hidden_size=self.hidden_size,
                   num_layers=self.num_layers,
                   goal_size=self.skill_n,
                   normalize_inputs=self.normalize_inputs)
     self.policy = StochasticPolicy(**kwargs)
     self.v_module = Value(use_antigoal=False, **kwargs)

Пример #4

Показать файл

    def _make_agent_modules(self):
        self.policy = Policy(self._dummy_env, 128, a_range=5, action_size=2)
        self.p_target = Policy(self._dummy_env, 128, a_range=5, action_size=2)
        self.p_target.load_state_dict(self.policy.state_dict())

        self.q_module = Critic(self._dummy_env, 128, a_range=5, action_size=2)
        self.q_target = Critic(self._dummy_env, 128, a_range=5, action_size=2)
        self.q_target.load_state_dict(self.q_module.state_dict())

        self.policy_lo = StochasticPolicy(self._dummy_env, 256, goal_size=2)
        self.v_module_lo = Value(self._dummy_env,
                                 256,
                                 goal_size=2,
                                 use_antigoal=False)

Пример #5

Показать файл

 def _make_agent_modules(self):
     self.policy = StochasticPolicy(self._dummy_env, 128)
     self.v_module = Value(self._dummy_env, 128, use_antigoal=False)

Пример #6

Показать файл

 def _make_agent_modules(self):
     self.policy = StochasticPolicy(self._dummy_env, 256)
     self.v_module = Value(self._dummy_env,
                           256,
                           use_antigoal=self.use_antigoal)