Exemplos de ReplayMemory.add_element em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: replay_memory

Classe / Tipo: ReplayMemory

Método / Função: add_element

Exemplos em hotexamples.com: 1

ReplayMemory.add_element em Python - 1 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de replay_memory.ReplayMemory.add_element em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

ReplayMemory(30)

add(30)

append(21)

enqueue(11)

add_transition(3)

batch(3)

add_experience(3)

add_episode(3)

clear(2)

enable_gbl(2)

disable_gbl(2)

__len__(2)

add_memory(2)

dump(1)

debug(1)

current_stats(1)

count(1)

batch_ops(1)

can_provide_sample(1)

add_element(1)

append_storage_chunk(1)

add_state_transition(1)

add_recent_state(1)

add_recent_action(1)

add_all(1)

Métodos Frequentes

ReplayMemory (30)

add (30)

append (21)

enqueue (11)

add_transition (3)

batch (3)

add_experience (3)

add_episode (3)

clear (2)

enable_gbl (2)

Métodos Frequentes

disable_gbl (2)

__len__ (2)

add_memory (2)

dump (1)

debug (1)

current_stats (1)

count (1)

batch_ops (1)

can_provide_sample (1)

add_element (1)

append_storage_chunk (1)

add_state_transition (1)

add_recent_state (1)

add_recent_action (1)

add_all (1)

Métodos Frequentes

append_storage_chunk (1)

add_state_transition (1)

add_recent_state (1)

add_recent_action (1)

add_all (1)

Exemplo n.º 1

0

Exibir arquivo

loss = reward - np.amax(Q_out) if not done: new_state = prepare_state(new_state) Q_out = Q(FloatTensor(new_state)).to('cpu').detach().numpy()[0] Q_targ_out = Q_targ( FloatTensor(new_state)).to('cpu').detach().numpy()[0] loss += gamma * Q_targ_out[np.argmax(Q_out)] loss = abs(loss) #print(curr_state.shape) replay_mem.add_element((curr_state, action, reward, new_state), loss) curr_state = new_state # #Learning # sarses = replay_mem.get_batch(batch_size) #Targets Q_true = [] #print() #print('+++++++++++++++++++++++++++')