Python EpisodicExperienceReplayParameters 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: rl_coach.memories.episodic.episodic_experience_replay

클래스/타입: EpisodicExperienceReplayParameters

hotexamples.com에서의 예제들: 13

Python EpisodicExperienceReplayParameters - 13개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 rl_coach.memories.episodic.episodic_experience_replay.EpisodicExperienceReplayParameters에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

EpisodicExperienceReplayParameters(13)

자주 사용되는 메소드들

EpisodicExperienceReplayParameters (13)

예제 #1

파일 보기

파일: td3_agent.py 프로젝트: bigdatasciencegroup/intel-ailab-reinforcement-learning-coach

 def __init__(self):
     td3_algorithm_params = TD3AlgorithmParameters()
     super().__init__(algorithm=td3_algorithm_params,
                      exploration=TD3AgentExplorationParameters(),
                      memory=EpisodicExperienceReplayParameters(),
                      networks=OrderedDict([("actor", TD3ActorNetworkParameters()),
                                            ("critic",
                                             TD3CriticNetworkParameters(td3_algorithm_params.num_q_networks))]))

예제 #2

파일 보기

파일: ddpg_agent.py 프로젝트: mdavala/coach

 def __init__(self):
     super().__init__(algorithm=DDPGAlgorithmParameters(),
                      exploration=OUProcessParameters(),
                      memory=EpisodicExperienceReplayParameters(),
                      networks=OrderedDict([
                          ("actor", DDPGActorNetworkParameters()),
                          ("critic", DDPGCriticNetworkParameters())
                      ]))

예제 #3

파일 보기

파일: clipped_ppo_agent.py 프로젝트: rickychau2780/deepracer

 def __init__(self):
     super().__init__(algorithm=ClippedPPOAlgorithmParameters(),
                      exploration={
                          DiscreteActionSpace: CategoricalParameters(),
                          BoxActionSpace: AdditiveNoiseParameters()
                      },
                      memory=EpisodicExperienceReplayParameters(),
                      networks={"main": ClippedPPONetworkParameters()})

예제 #4

파일 보기

 def __init__(self):
     super().__init__(algorithm=DDPGAlgorithmParameters(),
                      exploration=OUProcessParameters(),
                      memory=EpisodicExperienceReplayParameters(),
                      networks={
                          "actor": DDPGActorNetworkParameters(),
                          "critic": DDPGCriticNetworkParameters()
                      })

예제 #5

파일 보기

 def __init__(self):
     super().__init__(algorithm=PPOAlgorithmParameters(),
                      exploration=AdditiveNoiseParameters(),
                      memory=EpisodicExperienceReplayParameters(),
                      networks={
                          "critic": PPOCriticNetworkParameters(),
                          "actor": PPOActorNetworkParameters()
                      })

예제 #6

파일 보기

 def __init__(self):
     super().__init__(algorithm=PPOAlgorithmParameters(),
                      exploration={
                          DiscreteActionSpace: CategoricalParameters(),
                          BoxActionSpace: AdditiveNoiseParameters()
                      },
                      memory=EpisodicExperienceReplayParameters(),
                      networks={
                          "critic": PPOCriticNetworkParameters(),
                          "actor": PPOActorNetworkParameters()
                      })

예제 #7

파일 보기

 def __init__(self, agent_index, use_batchnorm=False):
     # def __init__(self, use_batchnorm=False, name, model, obs_shape_n, act_space_n, agent_index, local_q_func=False):
     #     self.agent_index = agent_index
     super().__init__(
         algorithm=MADDPGAlgorithmParameters(),
         exploration=OUProcessParameters(),
         memory=EpisodicExperienceReplayParameters(),
         networks=OrderedDict([
             ("actor" + str(agent_index),
              MADDPGActorNetworkParameters(use_batchnorm=use_batchnorm)),
             ("critic" + str(agent_index),
              MADDPGCriticNetworkParameters(use_batchnorm=use_batchnorm))
         ]))

예제 #8

파일 보기

 def __init__(self):
     super().__init__()
     self.algorithm = PALAlgorithmParameters()
     self.memory = EpisodicExperienceReplayParameters()

예제 #9

파일 보기

파일: acer_agent.py 프로젝트: shadiendrawis/coach

 def __init__(self):
     super().__init__(
         algorithm=ACERAlgorithmParameters(),
         exploration={DiscreteActionSpace: CategoricalParameters()},
         memory=EpisodicExperienceReplayParameters(),
         networks={"main": ACERNetworkParameters()})

예제 #10

파일 보기

파일: naf_agent.py 프로젝트: wwxFromTju/coach

 def __init__(self):
     super().__init__(algorithm=NAFAlgorithmParameters(),
                      exploration=OUProcessParameters(),
                      memory=EpisodicExperienceReplayParameters(),
                      networks={"main": NAFNetworkParameters()})

예제 #11

파일 보기

 def __init__(self):
     super().__init__(algorithm=HumanAlgorithmParameters(),
                      exploration=EGreedyParameters(),
                      memory=EpisodicExperienceReplayParameters(),
                      networks={"main": BCNetworkParameters()})

예제 #12

파일 보기

파일: mmc_agent.py 프로젝트: itaicaspi/coach

 def __init__(self):
     super().__init__()
     self.algorithm = MixedMonteCarloAlgorithmParameters()
     self.memory = EpisodicExperienceReplayParameters()

예제 #13

파일 보기

 def __init__(self):
     super().__init__(algorithm=ClippedPPOAlgorithmParameters(),
                      exploration=AdditiveNoiseParameters(),
                      memory=EpisodicExperienceReplayParameters(),
                      networks={"main": ClippedPPONetworkParameters()})