Python SimpleReplayBuffer.terminate_episode 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: rlkit.data_management.simple_replay_buffer

클래스/타입: SimpleReplayBuffer

메소드/함수: terminate_episode

hotexamples.com에서의 예제들: 2

Python SimpleReplayBuffer.terminate_episode - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 rlkit.data_management.simple_replay_buffer.SimpleReplayBuffer.terminate_episode에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

SimpleReplayBuffer(11)

add_sample(3)

random_batch(3)

set_buffer_from_dict(2)

terminate_episode(2)

add_path(1)

num_steps_can_sample(1)

예제 #1

파일 보기

 def test_num_steps_can_sample(self):
     buffer = SimpleReplayBuffer(10000, 1, 1)
     buffer.add_sample(1, 1, 1, False, 1)
     buffer.add_sample(1, 1, 1, True, 1)
     buffer.terminate_episode()
     buffer.add_sample(1, 1, 1, False, 1)
     self.assertEqual(buffer.num_steps_can_sample(), 3)

예제 #2

파일 보기

파일: convert_her_demos.py 프로젝트: yifan-you-37/rl_swiss

    obs = d['obs'][path_num]
    acs = d['acs'][path_num]
    env_infos = d['info'][path_num]

    ep_len = len(obs)
    for j in range(ep_len - 1):
        o = {
            'obs': obs[j]['observation'],
            'obs_task_params': obs[j]['desired_goal']
        }
        a = acs[j]
        r = 0.  # the demons don't come with reward
        terminal = 0  # none of the robotic environments in gym have terminal 1 ever
        next_o = {
            'obs': obs[j + 1]['observation'],
            'obs_task_params': obs[j + 1]['desired_goal']
        }
        env_info = env_infos[j]
        buffer.add_sample(o,
                          a,
                          r,
                          terminal,
                          next_o,
                          agent_info={},
                          env_info=env_info)
    buffer.terminate_episode()

# save it
file_name = os.path.join(rlkit_buffer_save_dir, 'extra_data.pkl')
joblib.dump({'replay_buffer': buffer}, file_name, compress=3)