Exemplos de train_eval em Python, exemplos de tf_agents.agents.dqn.examples.v2.train_eval.train_eval em Python

Exemplo n.º 1

0

Exibir arquivo

Arquivo: train_eval_test.py Projeto: egonina/agents

 def testDQNCartPole(self):
     root_dir = self.get_temp_dir()
     train_loss = train_eval.train_eval(root_dir,
                                        num_iterations=1,
                                        num_eval_episodes=1,
                                        initial_collect_steps=10)
     self.assertGreater(train_loss.loss, 0.0)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: train_eval_test.py Projeto: egonina/agents

 def testRNNDQNMaskedCartPole(self):
     root_dir = self.get_temp_dir()
     train_loss = train_eval.train_eval(root_dir,
                                        env_name='MaskedCartPole-v0',
                                        train_sequence_length=2,
                                        initial_collect_steps=10,
                                        num_eval_episodes=1,
                                        num_iterations=1)
     self.assertGreater(train_loss.loss, 0.0)

Exemplo n.º 3

0

Exibir arquivo

  def testDQNCartPole(self):
    if not tf.executing_eagerly():
      self.skipTest('Binary is eager-only.')

    root_dir = self.get_temp_dir()
    train_loss = train_eval.train_eval(root_dir,
                                       num_iterations=1,
                                       num_eval_episodes=1,
                                       initial_collect_steps=10)
    self.assertGreater(train_loss.loss, 0.0)

Exemplo n.º 4

0

Exibir arquivo

Arquivo: train_eval_test.py Projeto: whghdrms/agents-tutorial

    def testRNNDQNMaskedCartPole(self):
        if not tf.executing_eagerly():
            self.skipTest('Binary is eager-only.')

        root_dir = self.get_temp_dir()
        train_loss = train_eval.train_eval(root_dir,
                                           env_name='MaskedCartPole-v0',
                                           train_sequence_length=2,
                                           initial_collect_steps=10,
                                           num_eval_episodes=1,
                                           num_iterations=1)
        self.assertGreater(train_loss.loss, 0.0)