Python DQNAgent.step Exemples

Langage de programmation: Python

Espace de nommage/Pack: DQN

Class/Type: DQNAgent

Méthode/Fonction: step

Exemples au hotexamples.com: 2

Python DQNAgent.step - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de DQN.DQNAgent.step extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

DQNAgent(30)

epsilon(27)

remember(27)

replay_new(26)

train_short_memory(25)

set_reward(24)

get_state(24)

save(8)

train(6)

replay(3)

load(3)

act(3)

el_mejor_estado(2)

parameters(2)

act_test(2)

state_dict(2)

update_replay_memory(2)

step(2)

optimizer(2)

get_action(2)

update(2)

get_move(2)

to(2)

store_transition(1)

target_train(1)

test_agent(1)

train_policy(1)

train_model(1)

possible_moves(1)

save_model(1)

replay_memory(1)

predict(1)

player(1)

memoize(1)

loss_avg(1)

learn(1)

get_reward(1)

get_qs(1)

consider(1)

choose_action(1)

best_state(1)

add_memoria(1)

update_target_model(1)

Méthodes fréquemment utilisées

DQNAgent (30)

epsilon (27)

remember (27)

replay_new (26)

train_short_memory (25)

set_reward (24)

get_state (24)

save (8)

train (6)

replay (3)

Méthodes fréquemment utilisées

load (3)

act (3)

el_mejor_estado (2)

parameters (2)

act_test (2)

state_dict (2)

update_replay_memory (2)

step (2)

optimizer (2)

get_action (2)

update (2)

get_move (2)

to (2)

store_transition (1)

target_train (1)

test_agent (1)

train_policy (1)

train_model (1)

possible_moves (1)

save_model (1)

Méthodes fréquemment utilisées

update (2)

get_move (2)

to (2)

store_transition (1)

target_train (1)

test_agent (1)

train_policy (1)

train_model (1)

possible_moves (1)

save_model (1)

replay_memory (1)

predict (1)

player (1)

memoize (1)

loss_avg (1)

learn (1)

get_reward (1)

get_qs (1)

consider (1)

choose_action (1)

best_state (1)

add_memoria (1)

update_target_model (1)

Méthodes fréquemment utilisées

replay_memory (1)

predict (1)

player (1)

memoize (1)

loss_avg (1)

learn (1)

get_reward (1)

get_qs (1)

consider (1)

choose_action (1)

best_state (1)

add_memoria (1)

update_target_model (1)

Exemple #1

0

Afficher le fichier

#Catch KeyboardInterrupts and save model #i=-1 # try: # #Reinforcement Loop # #for i in tqdm.trange(n_episodes): # while True: # i += 1 for i in range(n_episodes): info, reward, state = env.reset( ) # reset env before starting a new episode j = 0 shortterm_memory = ReplayMemory(max_size=256) while True: j += 1 # interact with env action = agent.step(state) #observation, reward, done, info = env.step(action) done, base_reward, observation = env.step(action) #Determine real reward based on Policy reward = Policies.LiveLongAndProsper(base_reward, done) #reward = base_reward # store transaction in memory transition = [state, action, reward, observation, done] shortterm_memory.store(*transition) memory.store(*transition) # Step to next state state = observation

Exemple #2

0

Afficher le fichier

if torch.cuda.is_available(): torch.cuda.empty_cache() print("Running on GPU") agent.target_net.cuda() agent.policy_net.cuda() #Reinforcement Loop for i in range(n_episodes): info, reward, state = env.reset( ) # reset env before starting a new episode j = 0 while True: j += 1 # interact with env action = agent.step(state, decay_enabled=False) #observation, reward, done, info = env.step(action) done, reward, observation = env.step(action) #Determine real reward based on Policy #reward = Policies.SoreLoser(reward, done) # Step to next state state = observation #Save rewards for evaluation R[i] = reward #Reset if game lasts too long: #Protects against environment bug where agents can be trapped outside the arena