Python ReplayBuffer.from_data Examples

Programming Language: Python

Namespace/Package Name: tianshou.data

Class/Type: ReplayBuffer

Method/Function: from_data

Examples at hotexamples.com: 3

Python ReplayBuffer.from_data - 3 examples found. These are the top rated real world Python examples of tianshou.data.ReplayBuffer.from_data extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

ReplayBuffer(30)

add(30)

sample(18)

update(9)

reset(6)

get(6)

unfinished_index(4)

from_data(3)

sample_index(3)

update_weight(3)

next(2)

sample_indices(2)

load_hdf5(1)

prev(1)

__init__(1)

rew(1)

save_hdf5(1)

stack_num(1)

_add_to_buffer(1)

Example #1

Show file

def load_buffer(buffer_path: str) -> ReplayBuffer:
    with h5py.File(buffer_path, "r") as dataset:
        buffer = ReplayBuffer.from_data(obs=dataset["observations"],
                                        act=dataset["actions"],
                                        rew=dataset["rewards"],
                                        done=dataset["terminals"],
                                        obs_next=dataset["next_observations"])
    return buffer

Example #2

Show file

def load_buffer_d4rl(expert_data_task: str) -> ReplayBuffer:
    dataset = d4rl.qlearning_dataset(gym.make(expert_data_task))
    replay_buffer = ReplayBuffer.from_data(
        obs=dataset["observations"],
        act=dataset["actions"],
        rew=dataset["rewards"],
        done=dataset["terminals"],
        obs_next=dataset["next_observations"])
    return replay_buffer

Example #3

Show file

def test_from_data():
    obs_data = np.ndarray((10, 3, 3), dtype="uint8")
    for i in range(10):
        obs_data[i] = i * np.ones((3, 3), dtype="uint8")
    obs_next_data = np.zeros_like(obs_data)
    obs_next_data[:-1] = obs_data[1:]
    f, path = tempfile.mkstemp(suffix='.hdf5')
    os.close(f)
    with h5py.File(path, "w") as f:
        obs = f.create_dataset("obs", data=obs_data)
        act = f.create_dataset("act", data=np.arange(10, dtype="int32"))
        rew = f.create_dataset("rew", data=np.arange(10, dtype="float32"))
        done = f.create_dataset("done", data=np.zeros(10, dtype="bool"))
        obs_next = f.create_dataset("obs_next", data=obs_next_data)
        buf = ReplayBuffer.from_data(obs, act, rew, done, obs_next)
    assert len(buf) == 10
    batch = buf[3]
    assert np.array_equal(batch.obs, 3 * np.ones((3, 3), dtype="uint8"))
    assert batch.act == 3
    assert batch.rew == 3.0
    assert not batch.done
    assert np.array_equal(batch.obs_next, 4 * np.ones((3, 3), dtype="uint8"))
    os.remove(path)