Python WoLFAgent.observeの例

プログラミング言語: Python

名前空間/パッケージ名: wolf_agent

クラス/型: WoLFAgent

メソッド/関数: observe

hotexamples.comのコード掲載数: 2

Python WoLFAgent.observe - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのwolf_agent.WoLFAgent.observeの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

WoLFAgent(6)

observe(2)

act(1)

よく使われるメソッド

WoLFAgent (6)

observe (2)

act (1)

コード例 #1

ファイルを表示

ファイル: run.py プロジェクト: ipangkang/WOLF-PHC-for-multiagent

                       actions=actions,
                       high_delta=0.0004,
                       low_delta=0.0002)

    game = MatrixGame()
    for episode in range(nb_episode):
        actions = []
        action1 = agent1.act()
        action2 = agent2.act()
        action3 = agent3.act()
        actions.append(action1)
        actions.append(action2)
        actions.append(action3)
        _, reward = game.step(actions)

        agent1.observe(reward=reward[0])
        agent2.observe(reward=reward[1])
        agent3.observe(reward=reward[2])

    print(agent1.q_values)
    print(agent2.q_values)
    print(agent3.q_values)
    # plt.plot(np.arange(len(agent1.pi_history)),agent1.pi_history, label="agent1's pi(0)")
    # plt.plot(np.arange(len(agent2.pi_history)),agent2.pi_history, label="agent2's pi(0)")
    # plt.plot(np.arange(len(agent3.pi_history)),agent3.pi_history, label="agent3's pi(0)")
    # plt.ylim(0, 1)
    # plt.xlabel("episode")
    # plt.ylabel("pi(0)")
    # plt.legend()
    # plt.savefig("result.png")
    # plt.show()

コード例 #2

ファイルを表示

ファイル: run.py プロジェクト: tocom242242/wolf_phc

                       actions=actions,
                       high_delta=0.0004,
                       low_delta=0.0002)
    agent2 = WoLFAgent(alpha=0.1,
                       actions=actions,
                       high_delta=0.0004,
                       low_delta=0.0002)

    game = MatrixGame()
    for episode in range(nb_episode):
        action1 = agent1.act()
        action2 = agent2.act()

        _, r1, r2 = game.step(action1, action2)

        agent1.observe(reward=r1)
        agent2.observe(reward=r2)

    print(agent1.pi)
    print(agent2.pi)
    plt.plot(np.arange(len(agent1.pi_history)),
             agent1.pi_history,
             label="agent1's pi(0)")
    plt.plot(np.arange(len(agent2.pi_history)),
             agent2.pi_history,
             label="agent2's pi(0)")

    plt.ylim(0, 1)
    plt.xlabel("episode")
    plt.ylabel("pi(0)")
    plt.legend()