Esempi in Python per DQNAgent.act_2

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: dqn

Classe/tipologia: DQNAgent

Metodo/funzione: act_2

Esempi su hotexamples.com: 1

DQNAgent.act_2 in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per dqn.DQNAgent.act_2, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

DQNAgent(30)

act(13)

load(11)

compile(8)

fit(5)

save(5)

train(5)

replay(5)

test(4)

save_weights(4)

remember(4)

get_action(4)

load_model(4)

actDeterministically(4)

epsilon(3)

save_model(3)

load_weights(3)

target_model(2)

observe(2)

start(2)

get_last_observations(2)

end(2)

train_one_episode(1)

train_model(1)

trainAgent(1)

train_only(1)

update_epoch(1)

update_replay_memory(1)

test_one_episode(1)

test_model(1)

update_target(1)

store_transition(1)

train_rnn(1)

testAgent(1)

update_target_model(1)

train_vae(1)

training(1)

restart_epoch(1)

store_experience(1)

load_state_dict(1)

__init__(1)

act_2(1)

append_sample(1)

backword(1)

fill_memory(1)

get_test_loss(1)

learn(1)

loss(1)

step(1)

parameters(1)

Esempio n. 1

Mostra file

File: dqn_example.py Progetto: AndreErvilha/soccerGym

#load
agent.load("./save/example_dqn.h5")
done = False
batch_size = 32

for e in range(EPISODES):
    state = env.reset()
    state = np.reshape(state, [1, state_size])
    # print(e)
    last_reward = 0
    for time in range(1000):
        # delay.sleep(1/50)
        #render
        env.render()
        # action = agent.act(state)
        action = agent.act_2(state)
        commands = actions[action]

        # if env.key != '':
        #     # print(env.key-297)
        #     commands = actions[env.key-257]
        # else:
        #     commands = actions[0]

        # print(commands)
        # print(state)

        next_state, reward, done, _ = env.step2(commands)
        # reward = reward if not done else -10
        if (time == 0):
            last_reward = reward - 1