Python BalanceTask.discount示例

编程语言: Python

命名空间/包名称: tasks

类/类型: BalanceTask

方法/功能: discount

hotexamples.com的示例: 1

Python BalanceTask.discount - 已找到1个示例。这些是从开源项目中提取的最受好评的tasks.BalanceTask.discount现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

BalanceTask(2)

discount(1)

getObservation(1)

performAction(1)

示例#1

显示文件

from pybrain.rl.agents import LearningAgent
from pybrain.rl.learners.valuebased import NFQ, ActionValueNetwork
from pybrain.rl.experiments import EpisodicExperiment

from environment import Environment
from tasks import BalanceTask
from training import NFQTraining

task = BalanceTask()
action_value_function = ActionValueNetwork(task.outdim, task.nactions,
        name='BalanceNFQActionValueNetwork')
learner = NFQ()
learner.gamma = 0.9999
learner.explorer.epsilon = 0.9
task.discount = learner.gamma
agent = LearningAgent(action_value_function, learner)
performance_agent = LearningAgent(action_value_function, None)
experiment = EpisodicExperiment(task, agent)

tr = NFQTraining('balance_nfq', experiment, performance_agent)

tr.train(7000, performance_interval=1, n_performance_episodes=1, plotsave_interval=10, plot_action_history=True)