Ejemplos de A2CConfig en Python

Lenguaje de programación: Python

Namespace/Package Name: ray.rllib.agents.a3c

Método / Función: A2CConfig

Ejemplos en hotexamples.com: 3

Python A2CConfig - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de ray.rllib.agents.a3c.A2CConfig extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

 def test_a2c_exec_impl(self):
     config = a3c.A2CConfig().reporting(min_time_s_per_reporting=0)
     for _ in framework_iterator(config):
         trainer = a3c.A2CTrainer(env="CartPole-v0", config=config)
         results = trainer.train()
         check_train_results(results)
         print(results)
         check_compute_single_action(trainer)
         trainer.stop()

Ejemplo n.º 2

Mostrar archivo

Archivo: test_a2c.py Proyecto: tchordia/ray

    def test_a2c_exec_impl_microbatch(self):
        config = (a3c.A2CConfig().environment(env="CartPole-v0").reporting(
            min_time_s_per_reporting=0).training(microbatch_size=10))

        for _ in framework_iterator(config):
            trainer = config.build()
            results = trainer.train()
            check_train_results(results)
            print(results)
            check_compute_single_action(trainer)
            trainer.stop()

Ejemplo n.º 3

Mostrar archivo

    def test_a2c_compilation(self):
        """Test whether an A2CTrainer can be built with both frameworks."""
        config = a3c.A2CConfig().rollouts(num_rollout_workers=2, num_envs_per_worker=2)

        num_iterations = 1

        # Test against all frameworks.
        for _ in framework_iterator(config, with_eager_tracing=True):
            for env in ["CartPole-v0", "Pendulum-v1", "PongDeterministic-v0"]:
                trainer = config.build(env=env)
                for i in range(num_iterations):
                    results = trainer.train()
                    check_train_results(results)
                    print(results)
                check_compute_single_action(trainer)
                trainer.stop()