Python TransitionData.sample_batch_as_Transition 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: baconian.common.sampler.sample_data

클래스/타입: TransitionData

메소드/함수: sample_batch_as_Transition

hotexamples.com에서의 예제들: 2

Python TransitionData.sample_batch_as_Transition - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 baconian.common.sampler.sample_data.TransitionData.sample_batch_as_Transition에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

TransitionData(30)

append(30)

reset(6)

append_new_set(3)

get_copy(3)

return_generator(3)

apply_op(2)

apply_transformation(2)

get_mean_of(2)

get_sum_of(2)

sample_batch_as_Transition(2)

shuffle(2)

apply_normalization(1)

sample_batch(1)

union(1)

예제 #1

파일 보기

    def test_sample_batch_as_Transition_2(self):
        env = make('ModifiedHalfCheetah')
        env.init()
        env_spec = env.env_spec
        random_buffer = TransitionData(env_spec=env_spec, obs_shape=env_spec.obs_shape, \
                                       action_shape=env_spec.action_shape, size=100)
        print("====> Random Sample")
        num_trajectory = 1
        max_step = 100

        for i in range(num_trajectory):
            ep_len = 0
            obs = env.reset()
            while ep_len < max_step:
                act = self.RandomController_get_action(env=env, state=obs)
                obs_, reward, done, _ = env.step(act)
                random_buffer.append(obs, act, obs_, done, reward)
                assert not done
                obs = obs_
                ep_len += 1

        batch_data = random_buffer.sample_batch_as_Transition(
            batch_size=32, shuffle_flag=True, all_as_batch=True)
        self.assertEqual(len(batch_data), 4)
        self.assertEqual(len(batch_data[-1]), 4)

예제 #2

파일 보기

파일: test_scaler.py 프로젝트: yitongx/Baconian-public

    def test_StandScaler(self):
        env = make('ModifiedHalfCheetah')
        env_spec = env.env_spec
        self.assertEqual(env_spec.flat_obs_dim, 18)
        self.assertEqual(env_spec.flat_action_dim, 6)

        buffer_size = 10
        buffer = TransitionData(env_spec=env_spec, obs_shape=env_spec.obs_shape, \
                       action_shape=env_spec.action_shape, size=buffer_size)
        obs = env.reset()
        for i in range(buffer_size):
            act = env.action_space.sample()
            obs_, rew, done, _ = env.step(act)
            buffer.append(obs, act, obs_, done, rew)

        batch_list = buffer.sample_batch_as_Transition(4, all_as_batch=True)
        state_input_scaler_1 = RunningStandardScaler(env_spec.flat_action_dim)

        for batch_data in batch_list:
            state_input_scaler_1.update_scaler(batch_data.action_set)

        mean_1 = state_input_scaler_1._mean
        var_1 = state_input_scaler_1._var

        print(mean_1)
        print(var_1)

        state_input_scaler_2 = RunningStandardScaler(env_spec.flat_action_dim)
        state_input_scaler_2.update_scaler(buffer.action_set)
        mean_2 = state_input_scaler_2._mean
        var_2 = state_input_scaler_2._var
        print(mean_2)
        print(var_2)