Exemplos de KLCoeffMixin.init em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: ray.rllib.agents.ppo.ppo_torch_policy

Classe / Tipo: KLCoeffMixin

Método / Função: __init__

Exemplos em hotexamples.com: 5

KLCoeffMixin.__init__ em Python - 5 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de ray.rllib.agents.ppo.ppo_torch_policy.KLCoeffMixin.__init__ em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

__init__(5)

Métodos Frequentes

__init__ (5)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: ppo.py Projeto: wullli/flatlander

def setup_mixins(policy, obs_space, action_space, config): ValueNetworkMixin.__init__(policy, obs_space, action_space, config) KLCoeffMixin.__init__(policy, config) EntropyCoeffSchedule.__init__(policy, config["entropy_coeff"], config["entropy_coeff_schedule"]) warmup_steps = config["model"]["custom_options"].get( "warmup_steps", 100000) TransformerLearningRateSchedule.__init__( policy, config["model"]["custom_options"]["transformer"]["num_heads"], warmup_steps)

Exemplo n.º 2

0

Exibir arquivo

def setup_late_mixins(policy: Policy, obs_space: gym.spaces.Space, action_space: gym.spaces.Space, config: TrainerConfigDict): """Call all mixin classes' constructors after APPOPolicy initialization. Args: policy (Policy): The Policy object. obs_space (gym.spaces.Space): The Policy's observation space. action_space (gym.spaces.Space): The Policy's action space. config (TrainerConfigDict): The Policy's config. """ KLCoeffMixin.__init__(policy, config) ValueNetworkMixin.__init__(policy, obs_space, action_space, config) TargetNetworkMixin.__init__(policy)

Exemplo n.º 3

0

Exibir arquivo

Arquivo: appo_torch_policy.py Projeto: zjureel/ray

def setup_late_mixins(policy: Policy, obs_space: gym.spaces.Space, action_space: gym.spaces.Space, config: TrainerConfigDict): """Call all mixin classes' constructors after APPOPolicy initialization. Args: policy (Policy): The Policy object. obs_space (gym.spaces.Space): The Policy's observation space. action_space (gym.spaces.Space): The Policy's action space. config (TrainerConfigDict): The Policy's config. """ KLCoeffMixin.__init__(policy, config) ValueNetworkMixin.__init__(policy, obs_space, action_space, config) TargetNetworkMixin.__init__(policy, obs_space, action_space, config) # Move target net to device (this is done automatically for the # policy.model, but not for any other models the policy has). policy.target_model = policy.target_model.to(policy.device)

Exemplo n.º 4

0

Exibir arquivo

Arquivo: appo_torch_policy.py Projeto: zommiommy/ray

def setup_late_mixins(policy, obs_space, action_space, config): KLCoeffMixin.__init__(policy, config) ValueNetworkMixin.__init__(policy, obs_space, action_space, config) TargetNetworkMixin.__init__(policy, obs_space, action_space, config)

Exemplo n.º 5

0

Exibir arquivo

def setup_torch_mixins(policy, obs_space, action_space, config): # Copied from PPOTorchPolicy (w/o ValueNetworkMixin). TorchKLCoeffMixin.__init__(policy, config) TorchEntropyCoeffSchedule.__init__(policy, config["entropy_coeff"], config["entropy_coeff_schedule"]) TorchLR.__init__(policy, config["lr"], config["lr_schedule"])

Exemplos de KLCoeffMixin.__init__ em Python

Exemplos de KLCoeffMixin.init em Python