Python UniformlyRandomLatentSampler.get_actions示例

编程语言: Python

命名空间/包名称: hgail.policies.latent_sampler

方法/功能: get_actions

hotexamples.com的示例: 2

Python UniformlyRandomLatentSampler.get_actions - 已找到2个示例。这些是从开源项目中提取的最受好评的hgail.policies.latent_sampler.UniformlyRandomLatentSampler.get_actions现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

UniformlyRandomLatentSampler(10)

reset(3)

get_action(2)

get_actions(2)

示例#1

显示文件

文件： test_latent_sampler.py 项目： zxsted/hgail

    def test_reset(self):

        # single env
        dim = 3
        env_spec = MockEnvSpec()
        sampler = UniformlyRandomLatentSampler(
            scheduler=ConstantIntervalScheduler(), name='test', dim=dim)
        dones = [True]
        sampler.reset(dones)
        action, _ = sampler.get_action(None)
        self.assertTrue(sampler.latent_values.shape == (1, 3))
        self.assertTrue(np.sum(sampler.latent_values, axis=1) == 1)

        # multi env
        env_spec = MockEnvSpec(num_envs=2)
        dim = 100
        sampler = UniformlyRandomLatentSampler(
            scheduler=ConstantIntervalScheduler(), name='test', dim=dim)
        dones = [True, True]
        sampler.reset(dones)

        self.assertTrue(sampler.latent_values.shape == (2, dim))

        actions_1, _ = sampler.get_actions([None] * 2)
        sampler.reset(dones)

        actions_2, _ = sampler.get_actions([None] * 2)
        self.assertEqual(sampler.latent_values.shape, (2, dim))
        self.assertNotEqual(tuple(np.argmax(actions_1, axis=1)),
                            tuple(np.argmax(actions_2, axis=1)))

        dones = [False, True]
        sampler.reset(dones)
        np.testing.assert_array_equal(np.sum(sampler.latent_values, axis=1),
                                      [1, 1])

示例#2

显示文件

文件： test_latent_sampler.py 项目： zxsted/hgail

    def test_get_actions(self):
        dim = 2
        env_spec = MockEnvSpec(num_envs=5)
        sampler = UniformlyRandomLatentSampler(
            scheduler=ConstantIntervalScheduler(), name='test', dim=dim)
        sampler.reset([True] * 5)

        # scalar observations case
        obs = np.zeros((env_spec.num_envs, 3))
        latent, agent_info = sampler.get_actions(obs)
        self.assertEqual(latent.shape, (env_spec.num_envs, 2))