Python REPS.train Beispiele

Programmiersprache: Python

Namespace / Paketname: garage.tf.algos

Klasse / Typ: REPS

Methode / Funktion: train

Beispiele auf hotexamples.com: 2

Python REPS.train - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die garage.tf.algos.REPS.train, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

REPS(10)

train(2)

Häufig verwendete Methoden

REPS (10)

train (2)

Beispiel #1

Datei anzeigen

Datei: reps_gym_cartpole.py Projekt: Kelvinson/garage

def run_task(*_):
    """Wrap REPS training task in the run_task function."""
    env = TfEnv(gym.make("CartPole-v0"))

    policy = CategoricalMLPPolicy(env_spec=env.spec, hidden_sizes=[32, 32])

    baseline = LinearFeatureBaseline(env_spec=env.spec)

    algo = REPS(env=env,
                policy=policy,
                baseline=baseline,
                batch_size=4000,
                max_path_length=100,
                n_itr=100,
                discount=0.99,
                plot=False)

    algo.train()

Beispiel #2

Datei anzeigen

    def test_reps_cartpole(self):
        """Test REPS with gym Cartpole environment."""
        logger.reset()
        env = TfEnv(gym.make("CartPole-v0"))

        policy = CategoricalMLPPolicy(env_spec=env.spec, hidden_sizes=[32, 32])

        baseline = LinearFeatureBaseline(env_spec=env.spec)

        algo = REPS(env=env,
                    policy=policy,
                    baseline=baseline,
                    batch_size=4000,
                    max_path_length=100,
                    n_itr=10,
                    discount=0.99,
                    max_kl_step=1e6,
                    plot=False)

        last_avg_ret = algo.train(sess=self.sess)
        assert last_avg_ret > 5

        env.close()