Python ReplayBuffer.from_data 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: tianshou.data

클래스/타입: ReplayBuffer

메소드/함수: from_data

hotexamples.com에서의 예제들: 3

Python ReplayBuffer.from_data - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 tianshou.data.ReplayBuffer.from_data에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

ReplayBuffer(30)

add(30)

sample(18)

update(9)

reset(6)

get(6)

unfinished_index(4)

from_data(3)

sample_index(3)

update_weight(3)

next(2)

sample_indices(2)

load_hdf5(1)

prev(1)

__init__(1)

rew(1)

save_hdf5(1)

stack_num(1)

_add_to_buffer(1)

예제 #1

파일 보기

def load_buffer(buffer_path: str) -> ReplayBuffer:
    with h5py.File(buffer_path, "r") as dataset:
        buffer = ReplayBuffer.from_data(obs=dataset["observations"],
                                        act=dataset["actions"],
                                        rew=dataset["rewards"],
                                        done=dataset["terminals"],
                                        obs_next=dataset["next_observations"])
    return buffer

예제 #2

파일 보기

def load_buffer_d4rl(expert_data_task: str) -> ReplayBuffer:
    dataset = d4rl.qlearning_dataset(gym.make(expert_data_task))
    replay_buffer = ReplayBuffer.from_data(
        obs=dataset["observations"],
        act=dataset["actions"],
        rew=dataset["rewards"],
        done=dataset["terminals"],
        obs_next=dataset["next_observations"])
    return replay_buffer

예제 #3

파일 보기

def test_from_data():
    obs_data = np.ndarray((10, 3, 3), dtype="uint8")
    for i in range(10):
        obs_data[i] = i * np.ones((3, 3), dtype="uint8")
    obs_next_data = np.zeros_like(obs_data)
    obs_next_data[:-1] = obs_data[1:]
    f, path = tempfile.mkstemp(suffix='.hdf5')
    os.close(f)
    with h5py.File(path, "w") as f:
        obs = f.create_dataset("obs", data=obs_data)
        act = f.create_dataset("act", data=np.arange(10, dtype="int32"))
        rew = f.create_dataset("rew", data=np.arange(10, dtype="float32"))
        done = f.create_dataset("done", data=np.zeros(10, dtype="bool"))
        obs_next = f.create_dataset("obs_next", data=obs_next_data)
        buf = ReplayBuffer.from_data(obs, act, rew, done, obs_next)
    assert len(buf) == 10
    batch = buf[3]
    assert np.array_equal(batch.obs, 3 * np.ones((3, 3), dtype="uint8"))
    assert batch.act == 3
    assert batch.rew == 3.0
    assert not batch.done
    assert np.array_equal(batch.obs_next, 4 * np.ones((3, 3), dtype="uint8"))
    os.remove(path)