Ejemplos de Arguments.reward_scale en Python

Lenguaje de programación: Python

Namespace/Package Name: eRL.run

Clase / Tipo: Arguments

Método / Función: reward_scale

Ejemplos en hotexamples.com: 3

Python Arguments.reward_scale - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de eRL.run.Arguments.reward_scale extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Arguments(7)

env(7)

agent_rl(7)

net_dim(5)

break_step(4)

max_memo(3)

rollout_num(3)

reward_scale(3)

repeat_times(3)

eval_times1(3)

show_gap(2)

batch_size(2)

init_before_training(1)

max_step(1)

gpu_id(1)

eva_size(1)

env_eval(1)

if_break_early(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: beta0.py Proyecto: z4z5/ElegantRL

def demo41():
    args = Arguments(if_on_policy=True)
    args.agent_rl = agent.AgentGaePPO  # agent.AgentPPO

    import pybullet_envs  # for python-bullet-gym
    dir(pybullet_envs)
    args.env = decorate_env(gym.make('ReacherBulletEnv-v0'))

    args.break_step = int(5e4 * 8)  # (5e4) 1e5, UsedTime: (400s) 800s
    args.repeat_times = 2 ** 3
    args.reward_scale = 2 ** 1  # (-15) 18 (30)
    args.eval_times1 = 2 ** 2
    args.eval_times1 = 2 ** 6

    args.rollout_num = 4
    train_and_evaluate__multiprocessing(args)

Ejemplo n.º 2

Mostrar archivo

Archivo: beta0.py Proyecto: z4z5/ElegantRL

def demo42():
    args = Arguments(if_on_policy=True)
    args.agent_rl = agent.AgentGaePPO  # agent.AgentPPO

    import pybullet_envs  # for python-bullet-gym
    dir(pybullet_envs)
    args.env = decorate_env(gym.make('AntBulletEnv-v0'))
    args.break_step = int(5e6 * 8)  # (1e6) 5e6 UsedTime: 25697s
    args.reward_scale = 2 ** -3  #
    args.repeat_times = 2 ** 4
    args.net_dim = 2 ** 9
    args.batch_size = 2 ** 8
    args.max_memo = 2 ** 12
    args.show_gap = 2 ** 6
    args.eval_times1 = 2 ** 2

    args.rollout_num = 4
    train_and_evaluate__multiprocessing(args)

Ejemplo n.º 3

Mostrar archivo

Archivo: beta0.py Proyecto: z4z5/ElegantRL

def demo5():
    args = Arguments(if_on_policy=False)
    # args.agent_rl = agent.AgentModSAC
    args.agent_rl = agent.AgentInterSAC

    import pybullet_envs  # for python-bullet-gym
    dir(pybullet_envs)
    args.env = decorate_env(gym.make('AntBulletEnv-v0'))
    # args.env = decorate_env(gym.make('ReacherBulletEnv-v0'))

    args.break_step = int(1e6 * 8)  # (5e5) 1e6, UsedTime: (15,000s) 30,000s
    args.reward_scale = 2 ** -2  # (-50) 0 ~ 2500 (3340)
    args.max_memo = 2 ** 19
    args.net_dim = 2 ** 7  # todo
    args.eva_size = 2 ** 5  # for Recorder
    args.show_gap = 2 ** 8  # for Recorder

    train_and_evaluate(args)