Esempi in Python per AsyncSamplesOptimizer.stats

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: ray.rllib.optimizers

Metodo/funzione: stats

Esempi su hotexamples.com: 9

AsyncSamplesOptimizer.stats in Python: 9 esempi trovati. Questi sono i migliori esempi reali in Python per ray.rllib.optimizers.AsyncSamplesOptimizer.stats, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

AsyncSamplesOptimizer(27)

stats(7)

step(6)

collect_metrics(3)

reset(1)

Esempio n. 1

Mostra file

File: test_optimizers.py Progetto: denklewer/ray

 def testMultiplePasses(self):
     local, remotes = self._make_evs()
     optimizer = AsyncSamplesOptimizer(local,
                                       remotes,
                                       minibatch_buffer_size=10,
                                       num_sgd_iter=10,
                                       sample_batch_size=10,
                                       train_batch_size=50)
     self._wait_for(optimizer, 1000, 10000)
     self.assertLess(optimizer.stats()["num_steps_sampled"], 5000)
     self.assertGreater(optimizer.stats()["num_steps_trained"], 8000)

Esempio n. 2

Mostra file

 def test_multiple_passes(self):
     local, remotes = self._make_envs()
     workers = WorkerSet._from_existing(local, remotes)
     optimizer = AsyncSamplesOptimizer(workers,
                                       minibatch_buffer_size=10,
                                       num_sgd_iter=10,
                                       rollout_fragment_length=10,
                                       train_batch_size=50)
     self._wait_for(optimizer, 1000, 10000)
     self.assertLess(optimizer.stats()["num_steps_sampled"], 5000)
     self.assertGreater(optimizer.stats()["num_steps_trained"], 8000)

Esempio n. 3

Mostra file

File: test_optimizers.py Progetto: jamescasbon/ray

 def testMultiplePasses(self):
     local, remotes = self._make_evs()
     optimizer = AsyncSamplesOptimizer(
         local, remotes, {
             "minibatch_buffer_size": 10,
             "num_sgd_iter": 10,
             "sample_batch_size": 10,
             "train_batch_size": 50,
         })
     self._wait_for(optimizer, 1000, 10000)
     self.assertLess(optimizer.stats()["num_steps_sampled"], 5000)
     self.assertGreater(optimizer.stats()["num_steps_trained"], 8000)

Esempio n. 4

Mostra file

 def testReplay(self):
     local, remotes = self._make_evs()
     optimizer = AsyncSamplesOptimizer(
         local, remotes, {
             "replay_buffer_num_slots": 100,
             "replay_proportion": 10,
             "sample_batch_size": 10,
             "train_batch_size": 10,
         })
     self._wait_for(optimizer, 1000, 1000)
     self.assertLess(optimizer.stats()["num_steps_sampled"], 5000)
     self.assertGreater(optimizer.stats()["num_steps_replayed"], 8000)
     self.assertGreater(optimizer.stats()["num_steps_trained"], 8000)

Esempio n. 5

Mostra file

File: test_optimizers.py Progetto: jamescasbon/ray

 def testReplay(self):
     local, remotes = self._make_evs()
     optimizer = AsyncSamplesOptimizer(
         local, remotes, {
             "replay_buffer_num_slots": 100,
             "replay_proportion": 10,
             "sample_batch_size": 10,
             "train_batch_size": 10,
         })
     self._wait_for(optimizer, 1000, 1000)
     self.assertLess(optimizer.stats()["num_steps_sampled"], 5000)
     self.assertGreater(optimizer.stats()["num_steps_replayed"], 8000)
     self.assertGreater(optimizer.stats()["num_steps_trained"], 8000)

Esempio n. 6

Mostra file

File: test_optimizers.py Progetto: denklewer/ray

 def testReplay(self):
     local, remotes = self._make_evs()
     optimizer = AsyncSamplesOptimizer(
         local,
         remotes,
         replay_buffer_num_slots=100,
         replay_proportion=10,
         sample_batch_size=10,
         train_batch_size=10,
     )
     self._wait_for(optimizer, 1000, 1000)
     stats = optimizer.stats()
     self.assertLess(stats["num_steps_sampled"], 5000)
     replay_ratio = stats["num_steps_replayed"] / stats["num_steps_sampled"]
     self.assertGreater(replay_ratio, 0.7)
     self.assertLess(stats["num_steps_trained"], stats["num_steps_sampled"])

Esempio n. 7

Mostra file

File: test_optimizers.py Progetto: zhuohan123/ray

 def test_replay(self):
     local, remotes = self._make_envs()
     workers = WorkerSet._from_existing(local, remotes)
     optimizer = AsyncSamplesOptimizer(
         workers,
         replay_buffer_num_slots=100,
         replay_proportion=10,
         rollout_fragment_length=10,
         train_batch_size=10,
     )
     self._wait_for(optimizer, 1000, 1000)
     stats = optimizer.stats()
     self.assertLess(stats["num_steps_sampled"], 5000)
     replay_ratio = stats["num_steps_replayed"] / stats["num_steps_sampled"]
     self.assertGreater(replay_ratio, 0.7)
     self.assertLess(stats["num_steps_trained"], stats["num_steps_sampled"])

Esempio n. 8

Mostra file

    def testReplayAndMultiplePasses(self):
        local, remotes = self._make_envs()
        workers = WorkerSet._from_existing(local, remotes)
        optimizer = AsyncSamplesOptimizer(workers,
                                          minibatch_buffer_size=10,
                                          num_sgd_iter=10,
                                          replay_buffer_num_slots=100,
                                          replay_proportion=10,
                                          sample_batch_size=10,
                                          train_batch_size=10)
        self._wait_for(optimizer, 1000, 1000)

        stats = optimizer.stats()
        print(stats)
        self.assertLess(stats["num_steps_sampled"], 5000)
        replay_ratio = stats["num_steps_replayed"] / stats["num_steps_sampled"]
        self.assertGreater(replay_ratio, 0.7)

Esempio n. 9

Mostra file

File: test_optimizers.py Progetto: williamma12/ray

    def testReplayAndMultiplePasses(self):
        local, remotes = self._make_evs()
        optimizer = AsyncSamplesOptimizer(
            local, remotes, {
                "minibatch_buffer_size": 10,
                "num_sgd_iter": 10,
                "replay_buffer_num_slots": 100,
                "replay_proportion": 10,
                "sample_batch_size": 10,
                "train_batch_size": 10,
            })
        self._wait_for(optimizer, 1000, 1000)

        stats = optimizer.stats()
        print(stats)
        self.assertLess(stats["num_steps_sampled"], 5000)
        replay_ratio = stats["num_steps_replayed"] / stats["num_steps_sampled"]
        train_ratio = stats["num_steps_sampled"] / stats["num_steps_trained"]
        self.assertGreater(replay_ratio, 0.7)
        self.assertLess(train_ratio, 0.4)