Python PGAgent.train Beispiele

Programmiersprache: Python

Namespace / Paketname: ray.rllib.pg

Klasse / Typ: PGAgent

Methode / Funktion: train

Beispiele auf hotexamples.com: 2

Python PGAgent.train - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die ray.rllib.pg.PGAgent.train, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

PGAgent(3)

train(2)

Häufig verwendete Methoden

PGAgent (3)

train (2)

Beispiel #1

Datei anzeigen

 def testTrainCartpole(self):
     register_env("test", lambda _: SimpleServing(gym.make("CartPole-v0")))
     pg = PGAgent(env="test", config={"num_workers": 0})
     for i in range(100):
         result = pg.train()
         print("Iteration {}, reward {}, timesteps {}".format(
             i, result.episode_reward_mean, result.timesteps_total))
         if result.episode_reward_mean >= 100:
             return
     raise Exception("failed to improve reward")

Beispiel #2

Datei anzeigen

 def testTrainMultiCartpoleSinglePolicy(self):
     n = 10
     register_env("multi_cartpole", lambda _: MultiCartpole(n))
     pg = PGAgent(env="multi_cartpole", config={"num_workers": 0})
     for i in range(100):
         result = pg.train()
         print("Iteration {}, reward {}, timesteps {}".format(
             i, result.episode_reward_mean, result.timesteps_total))
         if result.episode_reward_mean >= 50 * n:
             return
     raise Exception("failed to improve reward")