Python LearningAgent.LearningAgent 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pybrain.rl.agents.learning

클래스/타입: LearningAgent

메소드/함수: LearningAgent

hotexamples.com에서의 예제들: 4

Python LearningAgent.LearningAgent - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pybrain.rl.agents.learning.LearningAgent.LearningAgent에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

LearningAgent(4)

__init__(3)

giveReward(2)

reset(2)

disableLearning(1)

getAction(1)

integrateObservation(1)

learn(1)

예제 #1

파일 보기

파일: BotMain.py 프로젝트: TurnTheTideTM/AI

 def __init__(self):
     self.this_ai_count = planet_environment.ai_count
     self.finished = False
     planet_environment.ai_count += 1
     self.nextMove = (0, 0, 0)
     self.state = None
     network = buildNetwork(INPUT_NEURON_COUNT, 100, 3)
     enac_learner = ENAC()
     learning_agent = LearningAgent(network, enac_learner)
     self.experiment = planet_experiment(episodic_planet_task(self),
                                         learning_agent)
     self.experiment.task.clipping = False

예제 #2

파일 보기

파일: aiplayer.py 프로젝트: SkyWox/hackcu

 def mlDriver(cv, stateTransfer, actionTransfer):
     #parameter setup
     #dimensionality of state argument (could be less than stateTransfer)
     stateDim = 352
     #Number of moves possible
     numMoves = 361
     env = SettleEnv(cv, stateTransfer, actionTransfer)
     task = SettleTask(env)
     controller = RestrictedActionValueNetwork(stateDim, numMoves, env)
     learner = NFQ()
     learner.explorer = EpsilonHackedExplorer(env)
     agent = LearningAgent(controller, learner)
     experiment = EpisodicExperiment(task, agent)
     while True:
         experiment.doEpisodes(10)
         print "Done with experiments"
         agent.learn()
         print "Learned"
         agent.reset()
         print "Cycled"

예제 #3

파일 보기

파일: play_cartpole.py 프로젝트: zyx061212/Kaggle

    sys.exit('please give 4 parameters. run: "python play_catpole.py <p1> <p2> <p3> <p4>"\n')

# create environment
env = CartPoleEnvironment()
env.setRenderer(CartPoleRenderer())
env.getRenderer().start()
env.delay = (episodes == 1)

# create task
task = BalanceTask(env, epilen)

# create controller network
net = buildNetwork(4, 1, bias=False)

# create agent and set parameters from command line
agent = LearningAgent(net, None)
agent.module._setParameters([float(sys.argv[1]), float(sys.argv[2]), float(sys.argv[3]), float(sys.argv[4])])

# create experiment
experiment = EpisodicExperiment(task, agent)
experiment.doEpisodes(episodes)

# run environment
ret = []
for n in range(agent.history.getNumSequences()):
    returns = agent.history.getSequence(n)
    reward = returns[2]
    ret.append( sum(reward, 0).item() )

# print results
print ret, "mean:",mean(ret)

예제 #4

파일 보기

 def __init__(self, n_input,actions, alpha=0.5, gamma=0.99, qlambda=0.9,explorer=EpsilonGreedyExplorer(epsilon=0.20,decay=1)):
     CompleteLearner.__init__(self,actions)
     controller = ActionValueNetwork(dimState=n_input, numActions=len(actions))
     learner = NFQ()
     learner.explorer = explorer
     self.learning_agent = LearningAgent(controller, learner)