Python OffPolicyTrainer.evaluate示例

编程语言: Python

命名空间/包名称: genrl.trainers

类/类型: OffPolicyTrainer

方法/功能: evaluate

hotexamples.com的示例: 3

Python OffPolicyTrainer.evaluate - 已找到3个示例。这些是从开源项目中提取的最受好评的genrl.trainers.OffPolicyTrainer.evaluate现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

OffPolicyTrainer(12)

train(11)

evaluate(3)

示例#1

显示文件

文件： test_trainer.py 项目： tzadouri/genrl

def test_off_policy_trainer():
    env = VectorEnv("Pendulum-v0", 2)
    algo = DDPG("mlp", env, replay_size=100)
    trainer = OffPolicyTrainer(
        algo,
        env,
        ["stdout"],
        epochs=2,
        evaluate_episodes=2,
        max_ep_len=300,
        max_timesteps=300,
    )
    assert trainer.off_policy
    trainer.train()
    trainer.evaluate()

示例#2

显示文件

文件： test_dqn.py 项目： veds12/genrl

 def test_vanilla_dqn(self):
     env = VectorEnv("CartPole-v0")
     algo = DQN("mlp", env, batch_size=5, replay_size=100, value_layers=[1, 1])
     assert isinstance(algo.model, MlpValue)
     trainer = OffPolicyTrainer(
         algo,
         env,
         log_mode=["csv"],
         logdir="./logs",
         max_ep_len=200,
         epochs=4,
         warmup_steps=10,
         start_update=10,
     )
     trainer.train()
     trainer.evaluate()
     shutil.rmtree("./logs")

示例#3

显示文件

文件： test_dqn_cnn.py 项目： veds12/genrl

 def test_double_dqn(self):
     env = VectorEnv("Pong-v0", env_type="atari")
     algo = DoubleDQN("cnn",
                      env,
                      batch_size=5,
                      replay_size=100,
                      value_layers=[1, 1])
     assert isinstance(algo.model, CnnValue)
     trainer = OffPolicyTrainer(
         algo,
         env,
         log_mode=["csv"],
         logdir="./logs",
         max_ep_len=200,
         epochs=4,
         warmup_steps=10,
         start_update=10,
     )
     trainer.train()
     trainer.evaluate()
     shutil.rmtree("./logs")