Python LearningAgent.disableLearning示例

编程语言: Python

命名空间/包名称: pybrain.rl.agents.learning

类/类型: LearningAgent

方法/功能: disableLearning

hotexamples.com的示例: 2

Python LearningAgent.disableLearning - 已找到2个示例。这些是从开源项目中提取的最受好评的pybrain.rl.agents.learning.LearningAgent.disableLearning现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

LearningAgent(4)

__init__(3)

giveReward(2)

reset(2)

disableLearning(1)

getAction(1)

integrateObservation(1)

learn(1)

示例#1

显示文件

文件： play_cartpole.py 项目： saadmahboob/pybrain

env = CartPoleEnvironment()
env.setRenderer(CartPoleRenderer())
env.getRenderer().start()
env.delay = (episodes == 1)

# create task
task = BalanceTask(env, epilen)
# create controller network
net = buildNetwork(4, 1, bias=False)
# set parameters from command line
# create agent
agent = LearningAgent(net, None)
agent.module._setParameters(
    array([
        float(sys.argv[1]),
        float(sys.argv[2]),
        float(sys.argv[3]),
        float(sys.argv[4])
    ]))
agent.disableLearning()
# create experiment
experiment = EpisodicExperiment(task, agent)
experiment.doEpisodes(episodes)
ret = []
for n in range(agent.history.getNumSequences()):
    returns = agent.history.getSequence(n)
    reward = returns[2]
    ret.append(sum(reward, 0).item())
print ret, "mean:", mean(ret)
env.getRenderer().stop()

示例#2

显示文件

文件： play_cartpole.py 项目： HKou/pybrain

if len(sys.argv) < 5:
    sys.exit('please give 4 parameters. run: "python play.py <p1> <p2> <p3> <p4>"\n')
     
# create environment
env = CartPoleEnvironment()    
env.setRenderer(CartPoleRenderer())
env.getRenderer().start()
env.delay = (episodes == 1)

# create task
task = BalanceTask(env, epilen)
# create controller network
net = buildNetwork(4, 1, bias=False)
# set parameters from command line
# create agent
agent = LearningAgent(net, None)
agent.module._setParameters(array([float(sys.argv[1]), float(sys.argv[2]), float(sys.argv[3]), float(sys.argv[4])])) 
agent.disableLearning()
# create experiment
experiment = EpisodicExperiment(task, agent)
experiment.doEpisodes(episodes)
ret = []
for n in range(agent.history.getNumSequences()):
    returns = agent.history.getSequence(n)
    reward = returns[2]
    ret.append( sum(reward, 0).item() )
print ret, "mean:",mean(ret)
env.getRenderer().stop()