Python process_rollout 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ray.rllib.a3c.runner

메소드/함수: process_rollout

hotexamples.com에서의 예제들: 2

Python process_rollout - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ray.rllib.a3c.runner.process_rollout에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def compute_gradient(self, params):
     self.policy.set_weights(params)
     rollout = self.pull_batch_from_queue()
     batch = process_rollout(rollout, gamma=0.99, lambda_=1.0)
     gradient = self.policy.get_gradients(batch)
     info = {"id": self.id, "size": len(batch.a)}
     return gradient, info

예제 #2

파일 보기

파일: a3c.py 프로젝트: pchalasani/ray

 def compute_gradient(self, params):
     self.policy.set_weights(params)
     rollout = self.pull_batch_from_queue()
     batch = process_rollout(rollout, gamma=0.99, lambda_=1.0)
     gradient, info = self.policy.get_gradients(batch)
     if "summary" in info:
         self.summary_writer.add_summary(
             tf.Summary.FromString(info['summary']),
             self.policy.local_steps)
         self.summary_writer.flush()
     info = {"id": self.id, "size": len(batch.a)}
     return gradient, info