Python A2C示例

编程语言: Python

命名空间/包名称: genrl.agents

类/类型: A2C

hotexamples.com的示例: 5

Python A2C - 已找到5个示例。这些是从开源项目中提取的最受好评的genrl.agents.A2C现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

A2C(5)

常用方法

A2C (5)

示例#1

显示文件

def main(args):
    env = VectorEnv(
        args.env, n_envs=args.n_envs, parallel=not args.serial, env_type=args.env_type
    )

    input_dim, action_dim, discrete, action_lim = get_env_properties(env, "mlp")

    network = MlpActorCritic(
        input_dim,
        action_dim,
        (1, 1),  # layers
        (1, 1),
        "V",  # type of value function
        discrete,
        action_lim=action_lim,
        activation="relu",
    )
    
    generic_agent = A2C(network, env, rollout_size=args.rollout_size)

    agent_parameter_choices = {
        "gamma": [12, 121],
        # 'clip_param': [0.2, 0.3],
        # 'lr_policy': [0.001, 0.002],
        # 'lr_value': [0.001, 0.002]
    }

    generate(
        args.generations,
        args.population,
        agent_parameter_choices,
        env,
        generic_agent,
        args,
    )

示例#2

显示文件

文件： test_a2c.py 项目： tzadouri/genrl

def test_a2c():
    env = VectorEnv("CartPole-v0", 1)
    algo = A2C("mlp", env, rollout_size=128)
    trainer = OnPolicyTrainer(algo,
                              env,
                              log_mode=["csv"],
                              logdir="./logs",
                              epochs=1)
    trainer.train()
    shutil.rmtree("./logs")

示例#3

显示文件

 def test_a2c_shared_discrete(self):
     env = VectorEnv("CartPole-v0", 1)
     algo = A2C("mlp", env, shared_layers=(32, 32), rollout_size=128)
     trainer = OnPolicyTrainer(algo,
                               env,
                               log_mode=["csv"],
                               logdir="./logs",
                               epochs=1)
     trainer.train()
     shutil.rmtree("./logs")

示例#4

显示文件

文件： test_a2c.py 项目： tzadouri/genrl

def test_a2c_cnn():
    env = VectorEnv("Pong-v0", 1, env_type="atari")
    algo = A2C("cnn", env, rollout_size=128)
    trainer = OnPolicyTrainer(algo,
                              env,
                              log_mode=["csv"],
                              logdir="./logs",
                              epochs=1)
    trainer.train()
    shutil.rmtree("./logs")

示例#5

显示文件

 def test_a2c_continuous(self):
     env = VectorEnv("Pendulum-v0", 1)
     algo = A2C("mlp", env, rollout_size=128)
     trainer = OnPolicyTrainer(algo,
                               env,
                               log_mode=["csv"],
                               logdir="./logs",
                               epochs=1)
     trainer.train()
     trainer.evaluate()
     shutil.rmtree("./logs")