Python PPOEvaluator.PPOEvaluator 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ray.rllib.ppo.ppo_evaluator

클래스/타입: PPOEvaluator

메소드/함수: PPOEvaluator

hotexamples.com에서의 예제들: 2

Python PPOEvaluator.PPOEvaluator - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ray.rllib.ppo.ppo_evaluator.PPOEvaluator.PPOEvaluator에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

PPOEvaluator(2)

obs_filter(2)

restore(2)

save(2)

update_kl(1)

예제 #1

파일 보기

    def _init(self):
        self.global_step = 0
        self.local_evaluator = PPOEvaluator(self.env_creator, self.config,
                                            self.logdir, False)
        RemotePPOEvaluator = ray.remote(
            num_cpus=self.config["num_cpus_per_worker"],
            num_gpus=self.config["num_gpus_per_worker"])(PPOEvaluator)
        self.remote_evaluators = [
            RemotePPOEvaluator.remote(self.env_creator, self.config,
                                      self.logdir, True)
            for _ in range(self.config["num_workers"])
        ]

        self.optimizer = LocalMultiGPUOptimizer(
            {
                "sgd_batch_size": self.config["sgd_batchsize"],
                "sgd_stepsize": self.config["sgd_stepsize"],
                "num_sgd_iter": self.config["num_sgd_iter"],
                "timesteps_per_batch": self.config["timesteps_per_batch"]
            },
            self.local_evaluator,
            self.remote_evaluators,
        )

        self.saver = tf.train.Saver(max_to_keep=None)

예제 #2

파일 보기

 def _init(self):
     self.global_step = 0
     self.kl_coeff = self.config["kl_coeff"]
     self.local_evaluator = PPOEvaluator(self.registry, self.env_creator,
                                         self.config, self.logdir, False)
     self.remote_evaluators = [
         RemotePPOEvaluator.remote(self.registry, self.env_creator,
                                   self.config, self.logdir, True)
         for _ in range(self.config["num_workers"])
     ]
     self.start_time = time.time()
     if self.config["write_logs"]:
         self.file_writer = tf.summary.FileWriter(
             self.logdir, self.local_evaluator.sess.graph)
     else:
         self.file_writer = None
     self.saver = tf.train.Saver(max_to_keep=None)