Python BalanceTask示例

编程语言: Python

命名空间/包名称: tasks

类/类型: BalanceTask

hotexamples.com的示例: 4

Python BalanceTask - 已找到4个示例。这些是从开源项目中提取的最受好评的tasks.BalanceTask现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

BalanceTask(2)

discount(1)

getObservation(1)

performAction(1)

示例#1

显示文件

文件： compare_with_c_source.py 项目： chrisdembia/agent-bicycle

from pybrain.rl.agents import LearningAgent
from pybrain.rl.learners.valuebased import NFQ, ActionValueNetwork
from pybrain.rl.experiments import EpisodicExperiment

from environment import Environment
from tasks import BalanceTask
from training import NFQTraining

task = BalanceTask()

task.performAction(1)


print task.getObservation()

task.performAction(2)

print task.getObservation()

task.performAction(3)

print task.getObservation()

示例#2

显示文件

文件： balance_nfq_onlysteer.py 项目： shehroze37-zz/agent-bicycle

from pybrain.rl.agents import LearningAgent
from pybrain.rl.learners.valuebased import NFQ, ActionValueNetwork
from pybrain.rl.experiments import EpisodicExperiment

from environment import Environment
from tasks import BalanceTask
from training import NFQTraining

task = BalanceTask(only_steer=True)
action_value_function = ActionValueNetwork(task.outdim, task.nactions,
        name='BalanceNFQActionValueNetwork')
learner = NFQ()
#learner.gamma = 0.99
#learner.explorer.epsilon = 0.5
task.discount = learner.gamma
agent = LearningAgent(action_value_function, learner)
performance_agent = LearningAgent(action_value_function, None)
experiment = EpisodicExperiment(task, agent)

tr = NFQTraining('balance_nfq', experiment, performance_agent)

tr.train(7000, performance_interval=1, n_performance_episodes=1, plot_action_history=True)

示例#3

显示文件

from pybrain.rl.agents import LearningAgent
from pybrain.rl.learners.valuebased import NFQ, ActionValueNetwork
from pybrain.rl.experiments import EpisodicExperiment

from environment import Environment
from tasks import BalanceTask
from training import NFQTraining

task = BalanceTask()
action_value_function = ActionValueNetwork(task.outdim, task.nactions,
        name='BalanceNFQActionValueNetwork')
learner = NFQ()
learner.gamma = 0.9999
learner.explorer.epsilon = 0.9
task.discount = learner.gamma
agent = LearningAgent(action_value_function, learner)
performance_agent = LearningAgent(action_value_function, None)
experiment = EpisodicExperiment(task, agent)

tr = NFQTraining('balance_nfq', experiment, performance_agent)

tr.train(7000, performance_interval=1, n_performance_episodes=1, plotsave_interval=10, plot_action_history=True)

示例#4

显示文件

文件： compare_with_c_source.py 项目： shehroze37-zz/agent-bicycle

from pybrain.rl.agents import LearningAgent
from pybrain.rl.learners.valuebased import NFQ, ActionValueNetwork
from pybrain.rl.experiments import EpisodicExperiment

from environment import Environment
from tasks import BalanceTask
from training import NFQTraining

task = BalanceTask()

task.performAction(1)

print task.getObservation()

task.performAction(2)

print task.getObservation()

task.performAction(3)

print task.getObservation()