Esempi in Python per RLTask.run

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: pyrobolearn.tasks

Classe/tipologia: RLTask

Metodo/funzione: run

Esempi su hotexamples.com: 2

RLTask.run in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per pyrobolearn.tasks.RLTask.run, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

RLTask(8)

run(2)

Metodi utilizzati di frequente

RLTask (8)

run (2)

Esempio n. 1

Mostra file

File: random_none.py Progetto: TESLA-Self-Driving-Car/PyRoboLearn-framework

# -*- coding: utf-8 -*-
#!/usr/bin/env python
"""Example on how to use the 'Cartpole' OpenAI Gym environments in PyRoboLearn using a random policy
"""

from pyrobolearn.envs import gym
from pyrobolearn.policies import RandomPolicy
from pyrobolearn.tasks import RLTask

# create env, state, and action from gym
env = gym.make('CartPole-v1')
state, action = env.state, env.action
print("State and action space: {} and {}".format(state.space, action.space))

# create policy
policy = RandomPolicy(state, action)

# create task and run it
task = RLTask(env, policy)
task.run(num_steps=1000, dt=0.02, use_terminating_condition=False, render=True)

Esempio n. 2

Mostra file

from pyrobolearn.envs import gym
from pyrobolearn.policies import LinearPolicy
from pyrobolearn.tasks import RLTask
from pyrobolearn.algos import FD

# create env, state, and action from gym
env = gym.make('CartPole-v1')
state, action = env.state, env.action
print("State and action space: {} and {}".format(state.space, action.space))

# create policy
policy = LinearPolicy(state, action)

# create task and run it
task = RLTask(env, policy)
task.run(num_steps=1000, use_terminating_condition=True, render=True)

# create RL algo
# Note: the hyperparameters can be a little bit tricky to optimize...
algo = FD(task,
          policy,
          std_dev=0.01,
          learning_rate=0.01,
          difference_type='central',
          normalize_grad=True)
rewards = algo.train(num_steps=1000,
                     num_rollouts=5,
                     num_episodes=50,
                     verbose=True)

# plot