Python QLearningAgent.save_weightsの例

プログラミング言語: Python

名前空間/パッケージ名: qLearningAgent

クラス/型: QLearningAgent

メソッド/関数: save_weights

hotexamples.comのコード掲載数: 2

Python QLearningAgent.save_weights - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのqLearningAgent.QLearningAgent.save_weightsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

QLearningAgent(7)

alpha(5)

epsilon(3)

debug(2)

load_weights(2)

save_weights(2)

getOptimum(1)

learn(1)

resetOptimum(1)

reshuffled(1)

setMoney(1)

setTraining(1)

コード例 #1

ファイルを表示

ファイル: run.py プロジェクト: james-lennon/CollaborativeLearningCTF

def team_test(load=False):
    game = Game(100, 100)

    agent1 = Agent()
    agent1b = Agent()
    agent2 = QLearningAgent(epsilon=0.5, alpha=.2, alpha_decay=1.0)
    agent2b = QLearningAgent(epsilon=0.5, alpha=.2, alpha_decay=1.0)

    if load:
        agent2.load_weights("team_weights.txt")
        agent2.alpha = 0

    # add agents
    game.add_agent(agent1, (47, 30), 0)
    game.add_agent(agent1b, (53, 30), 0)
    game.add_agent(agent2, (0, 0), 1)
    game.add_agent(agent2b, (0, 50), 1)

    # simulate game
    iterations = 10000

    atexit.register(lambda: agent2.save_weights("team_weights.txt"))

    game.start()
    # agent2.debug = True
    if not load: run_for_iterations(game, iterations)

    game.add_listener(GraphicsListener(game))
    agent2.epsilon = 0.01
    agent2b.epsilon = 0.01

    for _ in xrange(iterations):
        game.loop()
        time.sleep(.05)

コード例 #2

ファイルを表示

ファイル: run.py プロジェクト: james-lennon/CollaborativeLearningCTF

def single_agent_test(load=False):
    game = Game(100, 100)
    agent = QLearningAgent(alpha=.2, alpha_decay=1.0, epsilon=.5)

    if load:
        agent.load_weights("single_agent_weights.txt")
        agent.alpha = 0
        agent.epsilon = .01

    # add agents
    game.add_agent(agent, (25, 15), 0)

    # simulate game
    iterations = 50000

    atexit.register(lambda: agent.save_weights("single_agent_weights.txt"))

    game.start()

    # agent.debug = True
    if not load: run_for_iterations(game, 10000)

    game.add_listener(GraphicsListener(game))

    for _ in xrange(iterations):
        game.loop()
        time.sleep(.05)