Exemplos de MultivariateNormal.entropy em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: torch.distributions.multivariate_normal

Classe / Tipo: MultivariateNormal

Método / Função: entropy

Exemplos em hotexamples.com: 3

MultivariateNormal.entropy em Python - 3 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de torch.distributions.multivariate_normal.MultivariateNormal.entropy em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

MultivariateNormal(30)

log_prob(30)

sample(30)

rsample(26)

entropy(3)

__init__(2)

cuda(1)

mean(1)

np(1)

requires_grad(1)

reshape(1)

split(1)

Métodos Frequentes

MultivariateNormal (30)

log_prob (30)

sample (30)

rsample (26)

entropy (3)

__init__ (2)

cuda (1)

mean (1)

np (1)

requires_grad (1)

Métodos Frequentes

reshape (1)

split (1)

Exemplo n.º 1

0

Exibir arquivo

def evaluate_mj(mu, sigma, actions, clamp=None): """ Evaluate continuous actions/state batchwise. """ cov = torch.zeros(mu.shape[0],mu.shape[1],mu.shape[1]) # To diagonalize sigma batch wise. Converst batch_sizexD ---> batch_sizexDxD cov.as_strided(sigma.size(), [cov.stride(0), cov.size(2) + 1]).copy_(sigma) gauss = MultivariateNormal(mu, cov) log_probs = gauss.log_prob(actions) if clamp is not None: return torch.clamp(log_probs, min=-clamp, max=clamp), gauss.entropy() else: return log_probs, gauss.entropy()

Exemplo n.º 2

0

Exibir arquivo

def sample(self, x: torch.Tensor, raw_action: Optional[torch.Tensor] = None, deterministic: bool = False) -> Tuple[torch.Tensor, ...]: mean, log_std = self.forward(x) covariance = torch.diag_embed(log_std.exp()) dist = MultivariateNormal(loc=mean, scale_tril=covariance) if not raw_action: if self._reparameterize: raw_action = dist.rsample() else: raw_action = dist.sample() action = torch.tanh(raw_action) if self._squash else raw_action log_prob = dist.log_prob(raw_action).unsqueeze(-1) if self._squash: log_prob -= self._squash_correction(raw_action) entropy = dist.entropy().unsqueeze(-1) if deterministic: action = torch.tanh(dist.mean) return action, log_prob, entropy

Exemplo n.º 3

0

Exibir arquivo

def get_entropy(self, state): bsize = state.size(0) mu, std = self.forward(state) dist = MultivariateNormal(loc=mu, scale_tril=torch.diag_embed(std)) entropy = dist.entropy().view(bsize, 1) return entropy