Exemplos de AgentBuffer.sample_mini_batch em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: mlagents.trainers.buffer

Classe / Tipo: AgentBuffer

Método / Função: sample_mini_batch

Exemplos em hotexamples.com: 2

AgentBuffer.sample_mini_batch em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de mlagents.trainers.buffer.AgentBuffer.sample_mini_batch em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

AgentBuffer(27)

resequence_and_append(6)

keys(5)

reset_agent(5)

make_mini_batch(3)

sample_mini_batch(2)

truncate(2)

values(2)

_decode_key(1)

_encode_key(1)

last_brain_info(1)

load_from_file(1)

shuffle(1)

Métodos Frequentes

AgentBuffer (27)

resequence_and_append (6)

keys (5)

reset_agent (5)

make_mini_batch (3)

sample_mini_batch (2)

truncate (2)

values (2)

_decode_key (1)

_encode_key (1)

Métodos Frequentes

last_brain_info (1)

load_from_file (1)

shuffle (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: test_buffer.py Projeto: terite/HexChess

def test_buffer_sample(): agent_1_buffer = construct_fake_buffer(1) agent_2_buffer = construct_fake_buffer(2) update_buffer = AgentBuffer() agent_1_buffer.resequence_and_append(update_buffer, batch_size=None, training_length=2) agent_2_buffer.resequence_and_append(update_buffer, batch_size=None, training_length=2) # Test non-LSTM mb = update_buffer.sample_mini_batch(batch_size=4, sequence_length=1) assert mb.keys() == update_buffer.keys() assert np.array(mb[BufferKey.CONTINUOUS_ACTION]).shape == (4, 2) # Test LSTM # We need to check if we ever get a breaking start - this will maximize the probability mb = update_buffer.sample_mini_batch(batch_size=20, sequence_length=19) assert mb.keys() == update_buffer.keys() # Should only return one sequence assert np.array(mb[BufferKey.CONTINUOUS_ACTION]).shape == (19, 2)

Exemplo n.º 2

0

Exibir arquivo

def test_buffer_sample(): b = construct_fake_processing_buffer() update_buffer = AgentBuffer() b.append_to_update_buffer(update_buffer, 3, batch_size=None, training_length=2) b.append_to_update_buffer(update_buffer, 2, batch_size=None, training_length=2) # Test non-LSTM mb = update_buffer.sample_mini_batch(batch_size=4, sequence_length=1) assert mb.keys() == update_buffer.keys() assert np.array(mb["action"]).shape == (4, 2) # Test LSTM # We need to check if we ever get a breaking start - this will maximize the probability mb = update_buffer.sample_mini_batch(batch_size=20, sequence_length=19) assert mb.keys() == update_buffer.keys() # Should only return one sequence assert np.array(mb["action"]).shape == (19, 2)