Python DQNAgent.store_experience Exemples

Langage de programmation: Python

Espace de nommage/Pack: dqn

Class/Type: DQNAgent

Méthode/Fonction: store_experience

Exemples au hotexamples.com: 1

Python DQNAgent.store_experience - 1 exemples trouvés. Ce sont les exemples réels les mieux notés de dqn.DQNAgent.store_experience extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

DQNAgent(30)

act(13)

load(11)

compile(8)

fit(5)

save(5)

train(5)

replay(5)

test(4)

save_weights(4)

remember(4)

get_action(4)

load_model(4)

actDeterministically(4)

epsilon(3)

save_model(3)

load_weights(3)

target_model(2)

observe(2)

start(2)

get_last_observations(2)

end(2)

train_one_episode(1)

train_model(1)

trainAgent(1)

train_only(1)

update_epoch(1)

update_replay_memory(1)

test_one_episode(1)

test_model(1)

update_target(1)

store_transition(1)

train_rnn(1)

testAgent(1)

update_target_model(1)

train_vae(1)

training(1)

restart_epoch(1)

store_experience(1)

load_state_dict(1)

__init__(1)

act_2(1)

append_sample(1)

backword(1)

fill_memory(1)

get_test_loss(1)

learn(1)

loss(1)

step(1)

parameters(1)

Méthodes fréquemment utilisées

DQNAgent (30)

act (13)

load (11)

compile (8)

fit (5)

save (5)

train (5)

replay (5)

test (4)

save_weights (4)

Méthodes fréquemment utilisées

remember (4)

get_action (4)

load_model (4)

actDeterministically (4)

epsilon (3)

save_model (3)

load_weights (3)

target_model (2)

observe (2)

start (2)

get_last_observations (2)

end (2)

train_one_episode (1)

train_model (1)

trainAgent (1)

train_only (1)

update_epoch (1)

update_replay_memory (1)

test_one_episode (1)

test_model (1)

Méthodes fréquemment utilisées

get_last_observations (2)

end (2)

train_one_episode (1)

train_model (1)

trainAgent (1)

train_only (1)

update_epoch (1)

update_replay_memory (1)

test_one_episode (1)

test_model (1)

update_target (1)

store_transition (1)

train_rnn (1)

testAgent (1)

update_target_model (1)

train_vae (1)

training (1)

restart_epoch (1)

store_experience (1)

load_state_dict (1)

__init__ (1)

act_2 (1)

append_sample (1)

backword (1)

fill_memory (1)

get_test_loss (1)

learn (1)

loss (1)

step (1)

parameters (1)

Méthodes fréquemment utilisées

update_target (1)

store_transition (1)

train_rnn (1)

testAgent (1)

update_target_model (1)

train_vae (1)

training (1)

restart_epoch (1)

store_experience (1)

load_state_dict (1)

__init__ (1)

act_2 (1)

append_sample (1)

backword (1)

fill_memory (1)

get_test_loss (1)

learn (1)

loss (1)

step (1)

parameters (1)

play_game (1)

replay_memory (1)

reset (1)

Q_values (1)

score_actions (1)

select_action (1)

state_dict (1)

write_replay_memory (1)

Exemple #1

0

Afficher le fichier

while not terminal: state_t = state_t_1 # execute action in environment if steps > warmup: action_t = agent.select_action(state_t) else: action_t = np.random.choice(env.enable_actions) # observe environment state_t_1, reward_t, terminal = env.step(action_t) total_reward += reward_t # store experience agent.store_experience(state_t, action_t, reward_t, state_t_1, terminal) print(agent.tmp_q_values, np.argmax(agent.tmp_q_values), agent.enable_actions.index(action_t)) # for log frame += 1 steps += 1 if steps > warmup: loss += agent.current_loss Q_max += np.max(agent.Q_values([state_t])) # experience replay # warmup中は学習しない if steps > warmup: agent.backword()