Python DQNの例

プログラミング言語: Python

名前空間/パッケージ名: genrl.agents

クラス/型: DQN

hotexamples.comのコード掲載数: 4

Python DQN - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのgenrl.agents.DQNの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

DQN(4)

よく使われるメソッド

DQN (4)

コード例 #1

ファイルを表示

    def test_atari_env(self):
        """
        Tests working of Atari Wrappers and the AtariEnv function
        """
        env = VectorEnv("Pong-v0", env_type="atari")
        algo = DQN("cnn", env, replay_size=100)

        trainer = OffPolicyTrainer(algo, env, epochs=1, max_timesteps=50)
        trainer.train()
        shutil.rmtree("./logs")

コード例 #2

ファイルを表示

ファイル: test_dqn.py プロジェクト: threewisemonkeys-as/genrl

 def test_vanilla_dqn(self):
     env = VectorEnv("CartPole-v0")
     algo = DQN("mlp", env, batch_size=5, replay_size=100)
     assert isinstance(algo.model, MlpValue)
     trainer = OffPolicyTrainer(
         algo,
         env,
         log_mode=["csv"],
         logdir="./logs",
         max_ep_len=200,
         epochs=4,
         warmup_steps=10,
         start_update=10,
     )
     trainer.train()
     shutil.rmtree("./logs")

コード例 #3

ファイルを表示

ファイル: test_dqn_cnn.py プロジェクト: Sharad24/genrl

 def test_vanilla_dqn(self):
     env = VectorEnv("Pong-v0", env_type="atari")
     algo = DQN("cnn", env, batch_size=5, replay_size=100, value_layers=[1, 1])
     assert isinstance(algo.model, CnnValue)
     trainer = OffPolicyTrainer(
         algo,
         env,
         log_mode=["csv"],
         logdir="./logs",
         max_ep_len=200,
         epochs=4,
         warmup_steps=10,
         start_update=10,
         max_timesteps=100,
     )
     trainer.train()
     shutil.rmtree("./logs")

コード例 #4

ファイルを表示

    def test_atari_env(self):
        """
        Tests working of Atari Wrappers and the AtariEnv function
        """
        env = VectorEnv("Pong-v0", env_type="atari")
        algo = DQN("cnn",
                   env,
                   batch_size=5,
                   replay_size=100,
                   value_layers=[1, 1])

        trainer = OffPolicyTrainer(algo,
                                   env,
                                   epochs=5,
                                   max_ep_len=200,
                                   warmup_steps=10,
                                   start_update=10)
        trainer.train()
        shutil.rmtree("./logs")