Esempi in Python per MultiAgentEnvWrapper

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: ray.rllib.env.multi_agent_env

Classe/tipologia: MultiAgentEnvWrapper

Esempi su hotexamples.com: 4

MultiAgentEnvWrapper in Python: 4 esempi trovati. Questi sono i migliori esempi reali in Python per ray.rllib.env.multi_agent_env.MultiAgentEnvWrapper, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

MultiAgentEnvWrapper(4)

poll(3)

send_actions(2)

get_sub_environments(1)

try_reset(1)

Esempio n. 1

Mostra file

 def test_vectorize_round_robin(self):
     env = MultiAgentEnvWrapper(lambda v: RoundRobinMultiAgent(2), [], 2)
     obs, rew, dones, _, _ = env.poll()
     self.assertEqual(obs, {0: {0: 0}, 1: {0: 0}})
     self.assertEqual(rew, {0: {}, 1: {}})
     env.send_actions({0: {0: 0}, 1: {0: 0}})
     obs, rew, dones, _, _ = env.poll()
     self.assertEqual(obs, {0: {1: 0}, 1: {1: 0}})
     env.send_actions({0: {1: 0}, 1: {1: 0}})
     obs, rew, dones, _, _ = env.poll()
     self.assertEqual(obs, {0: {0: 0}, 1: {0: 0}})

Esempio n. 2

Mostra file

File: test_check_env.py Progetto: ray-project/ray

 def _make_base_env(self):
     del self
     num_envs = 2
     sub_envs = [
         make_multi_agent("CartPole-v1")({
             "num_agents": 2
         }) for _ in range(num_envs)
     ]
     env = MultiAgentEnvWrapper(None, sub_envs, 2)
     return env

Esempio n. 3

Mostra file

    def test_vectorize_basic(self):
        env = MultiAgentEnvWrapper(lambda v: BasicMultiAgent(2), [], 2)
        obs, rew, dones, _, _ = env.poll()
        self.assertEqual(obs, {0: {0: 0, 1: 0}, 1: {0: 0, 1: 0}})
        self.assertEqual(rew, {0: {}, 1: {}})
        self.assertEqual(
            dones,
            {
                0: {
                    "__all__": False
                },
                1: {
                    "__all__": False
                },
            },
        )
        for _ in range(24):
            env.send_actions({0: {0: 0, 1: 0}, 1: {0: 0, 1: 0}})
            obs, rew, dones, _, _ = env.poll()
            self.assertEqual(obs, {0: {0: 0, 1: 0}, 1: {0: 0, 1: 0}})
            self.assertEqual(rew, {0: {0: 1, 1: 1}, 1: {0: 1, 1: 1}})
            self.assertEqual(
                dones,
                {
                    0: {
                        0: False,
                        1: False,
                        "__all__": False
                    },
                    1: {
                        0: False,
                        1: False,
                        "__all__": False
                    },
                },
            )
        env.send_actions({0: {0: 0, 1: 0}, 1: {0: 0, 1: 0}})
        obs, rew, dones, _, _ = env.poll()
        self.assertEqual(
            dones,
            {
                0: {
                    0: True,
                    1: True,
                    "__all__": True
                },
                1: {
                    0: True,
                    1: True,
                    "__all__": True
                },
            },
        )

        # Reset processing
        self.assertRaises(
            ValueError, lambda: env.send_actions({
                0: {
                    0: 0,
                    1: 0
                },
                1: {
                    0: 0,
                    1: 0
                }
            }))
        self.assertEqual(env.try_reset(0), {0: {0: 0, 1: 0}})
        self.assertEqual(env.try_reset(1), {1: {0: 0, 1: 0}})
        env.send_actions({0: {0: 0, 1: 0}, 1: {0: 0, 1: 0}})
        obs, rew, dones, _, _ = env.poll()
        self.assertEqual(obs, {0: {0: 0, 1: 0}, 1: {0: 0, 1: 0}})
        self.assertEqual(rew, {0: {0: 1, 1: 1}, 1: {0: 1, 1: 1}})
        self.assertEqual(
            dones,
            {
                0: {
                    0: False,
                    1: False,
                    "__all__": False
                },
                1: {
                    0: False,
                    1: False,
                    "__all__": False
                },
            },
        )

Esempio n. 4

Mostra file

 def test_no_reset_until_poll(self):
     env = MultiAgentEnvWrapper(lambda v: BasicMultiAgent(2), [], 1)
     self.assertFalse(env.get_sub_environments()[0].resetted)
     env.poll()
     self.assertTrue(env.get_sub_environments()[0].resetted)