Python AgentBuffer.sample_mini_batch Beispiele

Programmiersprache: Python

Namespace / Paketname: mlagents.trainers.buffer

Klasse / Typ: AgentBuffer

Methode / Funktion: sample_mini_batch

Beispiele auf hotexamples.com: 2

Python AgentBuffer.sample_mini_batch - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die mlagents.trainers.buffer.AgentBuffer.sample_mini_batch, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

AgentBuffer(27)

resequence_and_append(6)

keys(5)

reset_agent(5)

make_mini_batch(3)

sample_mini_batch(2)

truncate(2)

values(2)

_decode_key(1)

_encode_key(1)

last_brain_info(1)

load_from_file(1)

shuffle(1)

Beispiel #1

Datei anzeigen

Datei: test_buffer.py Projekt: terite/HexChess

def test_buffer_sample():
    agent_1_buffer = construct_fake_buffer(1)
    agent_2_buffer = construct_fake_buffer(2)
    update_buffer = AgentBuffer()
    agent_1_buffer.resequence_and_append(update_buffer,
                                         batch_size=None,
                                         training_length=2)
    agent_2_buffer.resequence_and_append(update_buffer,
                                         batch_size=None,
                                         training_length=2)
    # Test non-LSTM
    mb = update_buffer.sample_mini_batch(batch_size=4, sequence_length=1)
    assert mb.keys() == update_buffer.keys()
    assert np.array(mb[BufferKey.CONTINUOUS_ACTION]).shape == (4, 2)

    # Test LSTM
    # We need to check if we ever get a breaking start - this will maximize the probability
    mb = update_buffer.sample_mini_batch(batch_size=20, sequence_length=19)
    assert mb.keys() == update_buffer.keys()
    # Should only return one sequence
    assert np.array(mb[BufferKey.CONTINUOUS_ACTION]).shape == (19, 2)

Beispiel #2

Datei anzeigen

def test_buffer_sample():
    b = construct_fake_processing_buffer()
    update_buffer = AgentBuffer()
    b.append_to_update_buffer(update_buffer,
                              3,
                              batch_size=None,
                              training_length=2)
    b.append_to_update_buffer(update_buffer,
                              2,
                              batch_size=None,
                              training_length=2)
    # Test non-LSTM
    mb = update_buffer.sample_mini_batch(batch_size=4, sequence_length=1)
    assert mb.keys() == update_buffer.keys()
    assert np.array(mb["action"]).shape == (4, 2)

    # Test LSTM
    # We need to check if we ever get a breaking start - this will maximize the probability
    mb = update_buffer.sample_mini_batch(batch_size=20, sequence_length=19)
    assert mb.keys() == update_buffer.keys()
    # Should only return one sequence
    assert np.array(mb["action"]).shape == (19, 2)