Python AgentBuffer.values примеры использования

Язык программирования: Python

Пространство имен/Пакет: mlagents.trainers.buffer

Класс/Тип: AgentBuffer

Метод/Функция: values

Примеров на hotexamples.com: 2

Python AgentBuffer.values - 2 примера найдено. Это лучшие примеры Python кода для mlagents.trainers.buffer.AgentBuffer.values, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

AgentBuffer(27)

resequence_and_append(6)

keys(5)

reset_agent(5)

make_mini_batch(3)

sample_mini_batch(2)

truncate(2)

values(2)

_decode_key(1)

_encode_key(1)

last_brain_info(1)

load_from_file(1)

shuffle(1)

Пример #1

Показать файл

Файл: test_buffer.py Проект: terite/HexChess

def test_buffer_truncate():
    agent_1_buffer = construct_fake_buffer(1)
    agent_2_buffer = construct_fake_buffer(2)
    update_buffer = AgentBuffer()
    agent_1_buffer.resequence_and_append(update_buffer,
                                         batch_size=None,
                                         training_length=2)
    agent_2_buffer.resequence_and_append(update_buffer,
                                         batch_size=None,
                                         training_length=2)
    # Test non-LSTM
    update_buffer.truncate(2)
    assert update_buffer.num_experiences == 2

    agent_1_buffer.resequence_and_append(update_buffer,
                                         batch_size=None,
                                         training_length=2)
    agent_2_buffer.resequence_and_append(update_buffer,
                                         batch_size=None,
                                         training_length=2)
    # Test LSTM, truncate should be some multiple of sequence_length
    update_buffer.truncate(4, sequence_length=3)
    assert update_buffer.num_experiences == 3
    for buffer_field in update_buffer.values():
        assert isinstance(buffer_field, AgentBufferField)

Пример #2

Показать файл

Файл: __init__.py Проект: chenh1001/Basketball-ML-Unity

 def evaluate_batch(self, mini_batch: AgentBuffer) -> RewardSignalResult:
     """
     Evaluates the reward for the data present in the Dict mini_batch. Use this when evaluating a reward
     function drawn straight from a Buffer.
     :param mini_batch: A Dict of numpy arrays (the format used by our Buffer)
         when drawing from the update buffer.
     :return: a RewardSignalResult of (scaled intrinsic reward, unscaled intrinsic reward) provided by the generator
     """
     mini_batch_len = len(next(iter(mini_batch.values())))
     return RewardSignalResult(
         self.strength * np.zeros(mini_batch_len, dtype=np.float32),
         np.zeros(mini_batch_len, dtype=np.float32),
     )