Esempi in Python per HFOAttackingPlayer.step

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: DiscreteHFO.HFOAttackingPlayer

Classe/tipologia: HFOAttackingPlayer

Metodo/funzione: step

Esempi su hotexamples.com: 2

HFOAttackingPlayer.step in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per DiscreteHFO.HFOAttackingPlayer.HFOAttackingPlayer.step, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

HFOAttackingPlayer(2)

reset(2)

step(2)

connectToServer(1)

connect_to_server(1)

quitGame(1)

Esempio n. 1

Mostra file

    hfoEnv.connectToServer()

    # Initialize a Q-Learning Agent
    agent = QLearningAgent(learningRate=0.1, discountFactor=0.99, epsilon=1.0)
    numEpisodes = args.numEpisodes

    # Run training using Q-Learning
    numTakenActions = 0
    for episode in range(numEpisodes):
        status = 0
        observation = hfoEnv.reset()

        while status == 0:
            learningRate, epsilon = agent.computeHyperparameters(
                numTakenActions, episode)
            agent.setEpsilon(epsilon)
            agent.setLearningRate(learningRate)

            obsCopy = observation.copy()
            agent.setState(agent.toStateRepresentation(obsCopy))
            action = agent.act()
            numTakenActions += 1

            nextObservation, reward, done, status = hfoEnv.step(action)
            agent.setExperience(agent.toStateRepresentation(obsCopy), action,
                                reward, status,
                                agent.toStateRepresentation(nextObservation))
            update = agent.learn()

            observation = nextObservation

Esempio n. 2

Mostra file

	parser = argparse.ArgumentParser()
	parser.add_argument('--id', type=int, default=0)
	parser.add_argument('--numOpponents', type=int, default=0)
	parser.add_argument('--numTeammates', type=int, default=0)
	parser.add_argument('--numEpisodes', type=int, default=500)

	args=parser.parse_args()

	hfoEnv = HFOAttackingPlayer(numOpponents = args.numOpponents, numTeammates = args.numTeammates, agentId = args.id)
	hfoEnv.connect_to_server()
	
	numEpisodes = 500
	for episode in range(numEpisodes+1):	

		status = 0
		observation = hfoEnv.reset()

		while status==0:
			act = random.randint(0,4)
			nextObservation, reward, done, status = hfoEnv.step(hfoEnv.possibleActions[act])
			observation = nextObservation

		if status == 5:
			hfoEnv.quitGame()
			break