Python SoftActorCritic.init 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: railrl.torch.sac.sac

클래스/타입: SoftActorCritic

메소드/함수: __init__

hotexamples.com에서의 예제들: 2

Python SoftActorCritic.__init__ - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 railrl.torch.sac.sac.SoftActorCritic.__init__에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

SoftActorCritic(10)

train(10)

to(8)

cuda(3)

__init__(2)

evaluate(1)

예제 #1

파일 보기

    def __init__(
        self,
        env,
        qf,
        vf,
        sac_kwargs,
        tdm_kwargs,
        base_kwargs,
        policy=None,
        replay_buffer=None,
        give_terminal_reward=False,
    ):
        SoftActorCritic.__init__(self,
                                 env=env,
                                 policy=policy,
                                 qf=qf,
                                 vf=vf,
                                 replay_buffer=replay_buffer,
                                 **sac_kwargs,
                                 **base_kwargs)
        TemporalDifferenceModel.__init__(self, **tdm_kwargs)
        action_space_diff = (self.env.action_space.high -
                             self.env.action_space.low)

        # TODO(vitchyr): Maybe add this to the main SAC code.
        terminal_reward = 0
        for dim in range(action_space_diff.size):
            terminal_reward += (-np.log(1. / action_space_diff[dim]))
        self.terminal_bonus = float(terminal_reward)
        self.give_terminal_reward = give_terminal_reward

예제 #2

파일 보기

 def __init__(self,
              *args,
              observation_key=None,
              desired_goal_key=None,
              **kwargs):
     HER.__init__(
         self,
         observation_key=observation_key,
         desired_goal_key=desired_goal_key,
     )
     SoftActorCritic.__init__(self, *args, **kwargs)
     assert isinstance(self.replay_buffer, ObsDictRelabelingBuffer)

Python SoftActorCritic.__init__ 예제들

Python SoftActorCritic.init 예제들