Python AgentBuffer.values Examples

Programming Language: Python

Namespace/Package Name: mlagents.trainers.buffer

Class/Type: AgentBuffer

Method/Function: values

Examples at hotexamples.com: 2

Python AgentBuffer.values - 2 examples found. These are the top rated real world Python examples of mlagents.trainers.buffer.AgentBuffer.values extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

AgentBuffer(27)

resequence_and_append(6)

keys(5)

reset_agent(5)

make_mini_batch(3)

sample_mini_batch(2)

truncate(2)

values(2)

_decode_key(1)

_encode_key(1)

last_brain_info(1)

load_from_file(1)

shuffle(1)

Example #1

Show file

File: test_buffer.py Project: terite/HexChess

def test_buffer_truncate():
    agent_1_buffer = construct_fake_buffer(1)
    agent_2_buffer = construct_fake_buffer(2)
    update_buffer = AgentBuffer()
    agent_1_buffer.resequence_and_append(update_buffer,
                                         batch_size=None,
                                         training_length=2)
    agent_2_buffer.resequence_and_append(update_buffer,
                                         batch_size=None,
                                         training_length=2)
    # Test non-LSTM
    update_buffer.truncate(2)
    assert update_buffer.num_experiences == 2

    agent_1_buffer.resequence_and_append(update_buffer,
                                         batch_size=None,
                                         training_length=2)
    agent_2_buffer.resequence_and_append(update_buffer,
                                         batch_size=None,
                                         training_length=2)
    # Test LSTM, truncate should be some multiple of sequence_length
    update_buffer.truncate(4, sequence_length=3)
    assert update_buffer.num_experiences == 3
    for buffer_field in update_buffer.values():
        assert isinstance(buffer_field, AgentBufferField)

Example #2

Show file

File: __init__.py Project: chenh1001/Basketball-ML-Unity

 def evaluate_batch(self, mini_batch: AgentBuffer) -> RewardSignalResult:
     """
     Evaluates the reward for the data present in the Dict mini_batch. Use this when evaluating a reward
     function drawn straight from a Buffer.
     :param mini_batch: A Dict of numpy arrays (the format used by our Buffer)
         when drawing from the update buffer.
     :return: a RewardSignalResult of (scaled intrinsic reward, unscaled intrinsic reward) provided by the generator
     """
     mini_batch_len = len(next(iter(mini_batch.values())))
     return RewardSignalResult(
         self.strength * np.zeros(mini_batch_len, dtype=np.float32),
         np.zeros(mini_batch_len, dtype=np.float32),
     )