Python ObservationActionEncoder示例

编程语言: Python

命名空间/包名称: tonic.torch.models

方法/功能: ObservationActionEncoder

hotexamples.com的示例: 3

Python ObservationActionEncoder - 已找到3个示例。这些是从开源项目中提取的最受好评的tonic.torch.models.ObservationActionEncoder现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

def default_model():
    return models.ActorTwinCriticWithTargets(
        actor=models.Actor(encoder=models.ObservationEncoder(),
                           torso=models.MLP((256, 256), torch.nn.ReLU),
                           head=models.DeterministicPolicyHead()),
        critic=models.Critic(encoder=models.ObservationActionEncoder(),
                             torso=models.MLP((256, 256), torch.nn.ReLU),
                             head=models.ValueHead()),
        observation_normalizer=normalizers.MeanStd())

示例#2

显示文件

文件： d4pg.py 项目： lorenzosteccanella/tonic

def default_model():
    return models.ActorCriticWithTargets(
        actor=models.Actor(encoder=models.ObservationEncoder(),
                           torso=models.MLP((256, 256), torch.nn.ReLU),
                           head=models.DeterministicPolicyHead()),
        critic=models.Critic(
            encoder=models.ObservationActionEncoder(),
            torso=models.MLP((256, 256), torch.nn.ReLU),
            # These values are for the control suite with 0.99 discount.
            head=models.DistributionalValueHead(-150., 150., 51)),
        observation_normalizer=normalizers.MeanStd())

示例#3

显示文件

def default_model():
    return models.ActorTwinCriticWithTargets(
        actor=models.Actor(
            encoder=models.ObservationEncoder(),
            torso=models.MLP((256, 256), torch.nn.ReLU),
            head=models.GaussianPolicyHead(
                loc_activation=torch.nn.Identity,
                distribution=models.SquashedMultivariateNormalDiag)),
        critic=models.Critic(encoder=models.ObservationActionEncoder(),
                             torso=models.MLP((256, 256), torch.nn.ReLU),
                             head=models.ValueHead()),
        observation_normalizer=normalizers.MeanStd())