Python ReplayBuffer.dump_buffer示例

编程语言: Python

命名空间/包名称: ai_traineree.buffers

类/类型: ReplayBuffer

方法/功能: dump_buffer

hotexamples.com的示例: 3

Python ReplayBuffer.dump_buffer - 已找到3个示例。这些是从开源项目中提取的最受好评的ai_traineree.buffers.ReplayBuffer.dump_buffer现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

ReplayBuffer(25)

add(15)

get_state(8)

sample(8)

add_sars(4)

from_state(4)

dump_buffer(3)

sample_sars(3)

clear(1)

load_buffer(1)

示例#1

显示文件

def test_replay_buffer_dump():
    import torch
    # Assign
    filled_buffer = 8
    prop_keys = ["state", "action", "reward", "next_state"]
    buffer = ReplayBuffer(batch_size=5, buffer_size=10)
    for sars in generate_sample_SARS(filled_buffer):
        buffer.add(state=torch.tensor(sars[0]),
                   reward=sars[1],
                   action=[sars[2]],
                   next_state=torch.tensor(sars[3]),
                   dones=sars[4])

    # Act
    dump = list(buffer.dump_buffer())

    # Assert
    assert all([len(dump) == filled_buffer])
    assert all([key in dump[0] for key in prop_keys])

示例#2

显示文件

def test_replay_buffer_dump_serializable():
    import json
    import torch
    # Assign
    filled_buffer = 8
    buffer = ReplayBuffer(batch_size=5, buffer_size=10)

    for sars in generate_sample_SARS(filled_buffer, dict_type=True):
        sars['state'] = torch.tensor(sars['state'])
        sars['next_state'] = torch.tensor(sars['next_state'])
        buffer.add(**sars)

    # Act
    dump = list(buffer.dump_buffer(serialize=True))

    # Assert
    ser_dump = json.dumps(dump)
    assert isinstance(ser_dump, str)
    assert json.loads(ser_dump) == dump

示例#3

显示文件

文件： interact.py 项目： laszukdawid/ai-traineree

    def callback(obs_t, obs_next, action, rew, done, *args, **kwargs):
        buffer.add(**dict(state=obs_t,
                          action=[action],
                          reward=[rew],
                          done=[done]),
                   next_state=obs_next)
        return [
            rew,
        ]

    return callback


buffer = ReplayBuffer(10, 2000)
callback = buffer_callback(buffer)
plotter = PlayPlot(callback, 30 * 5, ["reward"])

env_name = "Breakout-v0"
env = gym.make(env_name)
env.reset()
play(env, fps=20, callback=plotter.callback)

t = []
exp_dump = buffer.dump_buffer(serialize=True)
t.append(time.time())
with gzip.open('buffer.gzip', 'wt') as f:
    for exp in exp_dump:
        f.write(json.dumps(exp))
        f.write("\n")
t.append(time.time())
print(f"Writing to gzip took: {t[1]-t[0]} s")