Python SoccerEnv.step Beispiele

Programmiersprache: Python

Namespace / Paketname: soccer

Klasse / Typ: SoccerEnv

Methode / Funktion: step

Beispiele auf hotexamples.com: 2

Python SoccerEnv.step - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die soccer.SoccerEnv.step, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

SoccerEnv(5)

encode_action(5)

encode_state(3)

decode_action(2)

step(2)

close(1)

decode_reward(1)

done(1)

render(1)

reset(1)

reward(1)

transitions(1)

Beispiel #1

Datei anzeigen

Datei: tests.py Projekt: GMDennis/soccerenv

def test_render():
    env = SoccerEnv()
    env.render()
    action = env.encode_action(SoccerEnv.Action.Stick, SoccerEnv.Action.Stick)
    env.step(action)
    env.render()
    return

Beispiel #2

Datei anzeigen

Datei: scratch.py Projekt: cesleem/repro-papers-reinforcement-learning

ref_P1_action = int(SoccerEnv.Action.S)
ref_P2_action = int(SoccerEnv.Action.Stick)

# Q errors for plotting
Foe_Q_P1_Q_errors = []

for i_episode in range(n_episodes_MAX):
    state = env.reset()

    P1_Q_ref = Foe_Q_agent.Q[ref_state, ref_P1_action, ref_P2_action]

    for t in range(steps_MAX):
        joint_action = np.random.randint(num_actions)

        # Take action A, observe R, S'
        state_new, reward, done, info = env.step(joint_action)

        # Update Q
        P1_action, P2_action = env.decode_action(joint_action)
        P1_reward, P2_reward = env.decode_reward(state, reward)
        Foe_Q_agent.learn(P1_reward, state, state_new, P1_action, P2_action)

        state = state_new

        if done:
            # if verbose:
            #     print("Episode finished after {} timesteps".format(t + 1))
            break

    # calc error at end of episode update
    Foe_Q_P1_Q_errors.append(