Ejemplos de Normal.clamp_ en Python

Lenguaje de programación: Python

Namespace/Package Name: torch.distributions

Clase / Tipo: Normal

Método / Función: clamp_

Ejemplos en hotexamples.com: 1

Python Normal.clamp_ - 1 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de torch.distributions.Normal.clamp_ extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Normal(30)

entropy(30)

sample(30)

rsample(30)

log_prob(30)

sum(30)

cdf(30)

sample_n(16)

size(6)

icdf(5)

permute(4)

expand(4)

loc(4)

detach(4)

cpu(4)

mean(4)

scale(3)

gather(3)

backward(3)

reshape(2)

mode(2)

new_zeros(2)

item(2)

log(2)

exp(2)

add_(1)

pow(1)

sort(1)

square(1)

squeeze(1)

perplexity(1)

clamp(1)

numpy(1)

max(1)

clamp_(1)

__init__(1)

float(1)

flatten(1)

chunk(1)

cuda(1)

contiguous(1)

clip(1)

clamp_min_(1)

logsumexp(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: main.py Proyecto: km01/myrl

    global_rewards = []

    obs_gotten = None

    while frame_count < max_frame:

        cache = {'obs': [], 'acts': [], 'rews': [], 'dones': []}
        probs_cache = {'mu': [], 'sig': []}

        for _ in range(n_steps):
            obs = envs.reset() if obs_gotten is None else obs_gotten
            obs_in = torch.FloatTensor(obs).to(device)
            mu, sig = actor(obs_in)
            with torch.no_grad():
                a = Normal(mu, sig).sample()
                a.clamp_(-2.0 + 1e-7, 2.0 - 1e-7)

            obs_gotten, rews, dones, _ = envs.step(a)

            for i in range(num_envs):
                rewards[i][-1] += rews[i]
                if dones[i]:
                    global_rewards.append(rewards[i][-1])
                    rewards[i].append(0.)

            cache['obs'].append(obs)
            cache['acts'].append(a)
            cache['rews'].append(rews * 0.1)
            cache['dones'].append(dones)

            probs_cache['mu'].append(mu)