Esempi in Python per AttrDict.action_distribution

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: sample_factory.utils.utils

Classe/tipologia: AttrDict

Metodo/funzione: action_distribution

Esempi su hotexamples.com: 2

AttrDict.action_distribution in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per sample_factory.utils.utils.AttrDict.action_distribution, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

AttrDict(14)

action_distribution(2)

items(2)

obs(1)

Esempio n. 1

Mostra file

    def forward_tail(self, core_output, with_action_distribution=False):
        core_outputs = core_output.chunk(len(self.cores), dim=1)

        # first core output corresponds to the actor
        action_distribution_params, action_distribution = self.action_parameterization(
            core_outputs[0])
        # for non-trivial action spaces it is faster to do these together
        actions, log_prob_actions = sample_actions_log_probs(
            action_distribution)

        # second core output corresponds to the critic
        values = self.critic_linear(core_outputs[1])

        result = AttrDict(
            dict(
                actions=actions,
                action_logits=action_distribution_params,
                log_prob_actions=log_prob_actions,
                values=values,
            ))

        if with_action_distribution:
            result.action_distribution = action_distribution

        return result

Esempio n. 2

Mostra file

File: model.py Progetto: BoyuanLong/sample-factory

    def forward_tail(self, core_output, with_action_distribution=False):
        values = self.critic_linear(core_output)

        action_distribution_params, action_distribution = self.action_parameterization(core_output)

        # for non-trivial action spaces it is faster to do these together
        actions, log_prob_actions = sample_actions_log_probs(action_distribution)

        result = AttrDict(dict(
            actions=actions,
            action_logits=action_distribution_params,  # perhaps `action_logits` is not the best name here since we now support continuous actions
            log_prob_actions=log_prob_actions,
            values=values,
        ))

        if with_action_distribution:
            result.action_distribution = action_distribution

        return result