Python clip_but_pass_gradient 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: lyapunov_reachability.common.utils

메소드/함수: clip_but_pass_gradient

hotexamples.com에서의 예제들: 5

Python clip_but_pass_gradient - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 lyapunov_reachability.common.utils.clip_but_pass_gradient에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

0

파일 보기

파일: models.py 프로젝트: Kazimbalti/deeprl_safety_specification

 def forward(self, observation):
     if self.decoder is not None:
         state = self.decoder(observation)
     else:
         state = observation
     feature = self.extractor(state)
     log_lambda = self.lambda_layer(feature.view(-1, self.feature_size))
     return clip_but_pass_gradient(log_lambda, lower=-10., upper=6.)

예제 #2

0

파일 보기

파일: models.py 프로젝트: Kazimbalti/deeprl_safety_specification

 def forward(self, observation, action):
     if self.decoder is not None:
         state = self.decoder(observation)
     else:
         state = observation
     # Compute Q--value.
     feature = self.extractor(torch.cat((state, action), dim=-1))
     pre_q = self.value_layer(feature.view(-1, self.feature_size))
     return clip_but_pass_gradient(pre_q, 0., 1.)

예제 #3

0

파일 보기

파일: models.py 프로젝트: Kazimbalti/deeprl_safety_specification

    def log_prob(self, observation, action):
        if self.decoder is not None:
            state = self.decoder(observation)
        else:
            state = observation
        feature = self.extractor(state).view(-1, self.feature_size)
        mean = self.mean_layer(feature)
        logstd = clip_but_pass_gradient(self.logstd_layer(feature), -6., 2.)

        pre_action = atanh(action)
        log_prob = normal_likelihood(
            pre_action, mean, logstd) - torch.log(-action**2 + 1. + EPS).sum(
                1, keepdim=True)

        return log_prob

예제 #4

0

파일 보기

파일: models.py 프로젝트: Kazimbalti/deeprl_safety_specification

    def sample(self, observation, deterministic=False):
        if self.decoder is not None:
            state = self.decoder(observation)
        else:
            state = observation
        feature = self.extractor(state).view(-1, self.feature_size)
        mean = self.mean_layer(feature)
        logstd = clip_but_pass_gradient(self.logstd_layer(feature), -6., 2.)
        std = torch.exp(logstd)

        if deterministic:
            return torch.tanh(mean)
        else:
            pre_sample = mean + std * torch.randn(
                mean.size(), dtype=mean.dtype, device=mean.device)
            return torch.tanh(pre_sample)

예제 #5

0

파일 보기

파일: models.py 프로젝트: Kazimbalti/deeprl_safety_specification

    def forward(self, observation):
        if self.decoder is not None:
            state = self.decoder(observation)
        else:
            state = observation
        feature = self.extractor(state).view(-1, self.feature_size)
        mean = self.mean_layer(feature)
        logstd = clip_but_pass_gradient(self.logstd_layer(feature), -6., 2.)
        std = torch.exp(logstd)

        # Reparameterization trick
        pre_sample = mean + std * torch.randn(
            mean.size(), dtype=mean.dtype, device=mean.device)
        sample = torch.tanh(pre_sample)
        log_prob = normal_likelihood(
            pre_sample, mean, logstd) - torch.log(-sample**2 + 1. + EPS).sum(
                1, keepdim=True)

        return sample, torch.tanh(mean), log_prob