Python HFOAttackingPlayer.resetの例

プログラミング言語: Python

名前空間/パッケージ名: DiscreteHFO.HFOAttackingPlayer

クラス/型: HFOAttackingPlayer

メソッド/関数: reset

hotexamples.comのコード掲載数: 2

Python HFOAttackingPlayer.reset - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのDiscreteHFO.HFOAttackingPlayer.HFOAttackingPlayer.resetの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

HFOAttackingPlayer(2)

reset(2)

step(2)

connectToServer(1)

connect_to_server(1)

quitGame(1)

コード例 #1

ファイルを表示

    # Initialize connection with the HFO server
    hfoEnv = HFOAttackingPlayer(numOpponents=args.numOpponents,
                                numTeammates=args.numTeammates,
                                agentId=args.id)
    hfoEnv.connectToServer()

    # Initialize a Q-Learning Agent
    agent = QLearningAgent(learningRate=0.1, discountFactor=0.99, epsilon=1.0)
    numEpisodes = args.numEpisodes

    # Run training using Q-Learning
    numTakenActions = 0
    for episode in range(numEpisodes):
        status = 0
        observation = hfoEnv.reset()

        while status == 0:
            learningRate, epsilon = agent.computeHyperparameters(
                numTakenActions, episode)
            agent.setEpsilon(epsilon)
            agent.setLearningRate(learningRate)

            obsCopy = observation.copy()
            agent.setState(agent.toStateRepresentation(obsCopy))
            action = agent.act()
            numTakenActions += 1

            nextObservation, reward, done, status = hfoEnv.step(action)
            agent.setExperience(agent.toStateRepresentation(obsCopy), action,
                                reward, status,

コード例 #2

ファイルを表示

ファイル: DiscretizedRandomAttackingController.py プロジェクト: windcomes/RL2019-BaseCodes

if __name__ == '__main__':

    parser = argparse.ArgumentParser()
    parser.add_argument('--id', type=int, default=0)
    parser.add_argument('--numOpponents', type=int, default=0)
    parser.add_argument('--numTeammates', type=int, default=0)
    parser.add_argument('--numEpisodes', type=int, default=500)

    args = parser.parse_args()

    hfoEnv = HFOAttackingPlayer(numOpponents=args.numOpponents,
                                numTeammates=args.numTeammates,
                                agentId=args.id)
    hfoEnv.connectToServer()

    numEpisodes = 500
    for episode in range(numEpisodes + 1):

        status = 0
        observation = hfoEnv.reset()  #恢复到初始状态

        while status == 0:
            act = random.randint(0, 4)
            nextObservation, reward, done, status = hfoEnv.step(
                hfoEnv.possibleActions[act])  #将所选动作传递给agent
            observation = nextObservation

        if status == 5:
            hfoEnv.quitGame()
            break