Ejemplos de ExperimentPPO.ExperimentPPO en Python

Lenguaje de programación: Python

Namespace/Package Name: experiment.ppo_experiment

Clase / Tipo: ExperimentPPO

Método / Función: ExperimentPPO

Ejemplos en hotexamples.com: 8

Python ExperimentPPO.ExperimentPPO - 8 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de experiment.ppo_experiment.ExperimentPPO.ExperimentPPO extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

ExperimentPPO(8)

run_baseline(3)

add_preprocess(2)

run_dop_model(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: PPO_AtariGame.py Proyecto: Iskandor/MotivationModels

def run_forward_model(config, trial, env_name):
    env = WrapperAtari(gym.make(env_name))
    input_shape = env.observation_space.shape
    action_dim = env.action_space.n

    if config.n_env > 1:
        env_list = []
        print('Creating {0:d} environments'.format(config.n_env))
        for i in range(config.n_env):
            env_list.append(WrapperAtari(gym.make(env_name)))

        print('Start training')
        experiment = ExperimentNEnvPPO(env_name, env_list, config, input_shape, action_dim)
    else:
        experiment = ExperimentPPO(env_name, env, config)
        experiment.add_preprocess(encode_state)

    agent = PPOAtariForwardModelAgent(input_shape, action_dim, config, TYPE.discrete)
    experiment.run_forward_model(agent, trial)

    env.close()

    if config.n_env > 1:
        for i in range(config.n_env):
            env_list[i].close()

Ejemplo n.º 2

Mostrar archivo

def run_dop_ref_model(env_name, config, i):
    env = create_env(env_name)
    state_dim = env.observation_space.shape
    action_dim = env.action_space.shape[0]

    experiment = ExperimentPPO(env_name, env, config)

    agent = PPOAerisDOPRefAgent(state_dim, action_dim, config, TYPE.continuous)
    experiment.run_baseline(agent, i)

    env.close()

Ejemplo n.º 3

Mostrar archivo

def run_baseline(config, i):
    env = gym.make('MountainCarContinuous-v0')
    state_dim = env.observation_space.shape[0]
    action_dim = env.action_space.shape[0]

    experiment = ExperimentPPO('MountainCarContinuous-v0', env, config)

    agent = PPOSimpleAgent(state_dim, action_dim, config, TYPE.continuous)
    experiment.run_baseline(agent, i)

    env.close()

Ejemplo n.º 4

Mostrar archivo

Archivo: PPO_Pendulum.py Proyecto: Iskandor/MotivationModels

def run_baseline(config, i):
    env = gym.make('Pendulum-v0')
    state_dim = env.observation_space.shape[0]
    action_dim = env.action_space.shape[0]

    experiment = ExperimentPPO('Pendulum-v0', env, config)
    experiment.add_preprocess(encode)

    agent = PPOAgent(state_dim, action_dim, config, TYPE.continuous)
    experiment.run_baseline(agent, i)

    env.close()

Ejemplo n.º 5

Mostrar archivo

Archivo: PPO_AtariGame.py Proyecto: Iskandor/MotivationModels

def test(config, path, env_name):
    env = WrapperAtari(gym.make(env_name))
    input_shape = env.observation_space.shape
    action_dim = env.action_space.n

    experiment = ExperimentPPO(env_name, env, config)
    experiment.add_preprocess(encode_state)

    agent = PPOAtariAgent(input_shape, action_dim, config, TYPE.discrete)
    agent.load(path)
    experiment.test(agent)

    env.close()

Ejemplo n.º 6

Mostrar archivo

Archivo: PPO_AtariGame.py Proyecto: Iskandor/MotivationModels

def run_rnd_model(config, trial, env_name):
    if config.n_env > 1:
        print('Creating {0:d} environments'.format(config.n_env))
        env = MultiEnvParallel([WrapperAtari(gym.make(env_name)) for _ in range(config.n_env)], config.n_env, config.num_threads)
    else:
        env = WrapperAtari(gym.make(env_name))

    input_shape = env.observation_space.shape
    action_dim = env.action_space.n

    print('Start training')
    if config.n_env > 1:
        experiment = ExperimentNEnvPPO(env_name, env, config)
    else:
        experiment = ExperimentPPO(env_name, env, config)

    experiment.add_preprocess(encode_state)
    agent = PPOAtariRNDAgent(input_shape, action_dim, config, TYPE.discrete)
    experiment.run_rnd_model(agent, trial)

    env.close()

Ejemplo n.º 7

Mostrar archivo

def run_baseline(env_name, config, trial):
    if config.n_env > 1:
        print('Creating {0:d} environments'.format(config.n_env))
        env = MultiEnvParallel(
            [create_env(env_name) for _ in range(config.n_env)], config.n_env,
            config.num_threads)
    else:
        env = create_env(env_name)

    input_shape = env.observation_space.shape
    action_dim = env.action_space.shape[0]

    print('Start training')
    if config.n_env > 1:
        experiment = ExperimentNEnvPPO(env_name, env, config)
    else:
        experiment = ExperimentPPO(env_name, env, config)

    agent = PPOAerisAgent(input_shape, action_dim, config, TYPE.continuous)
    experiment.run_baseline(agent, trial)

    env.close()

Ejemplo n.º 8

Mostrar archivo

Archivo: PPO_CartPole.py Proyecto: Iskandor/MotivationModels

def run_baseline(config, trial):
    env = gym.make('CartPole-v0')
    state_dim = env.observation_space.shape[0]
    action_dim = env.action_space.n

    if config.n_env > 1:
        env_list = []
        print('Creating {0:d} environments'.format(config.n_env))
        for i in range(config.n_env):
            env_list.append(gym.make('CartPole-v0'))

        print('Start training')
        experiment = ExperimentNEnvPPO('Pitfall-v0', env_list, config)
    else:
        experiment = ExperimentPPO('Pitfall-v0', env, config)

    agent = PPOSimpleAgent(state_dim, action_dim, config, TYPE.discrete)
    experiment.run_baseline(agent, trial)

    env.close()

    if config.n_env > 1:
        for i in range(config.n_env):
            env_list[i].close()