Python CircularBuffer.append 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: experience_replay

클래스/타입: CircularBuffer

메소드/함수: append

hotexamples.com에서의 예제들: 2

Python CircularBuffer.append - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 experience_replay.CircularBuffer.append에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

CircularBuffer(3)

append(2)

__array__(1)

자주 사용되는 메소드들

CircularBuffer (3)

append (2)

__array__ (1)

예제 #1

파일 보기

파일: test_circular_buffer.py 프로젝트: renatolfc/dqn-ale

class TestCircularBuffer:
    def test_append(self):
        self.buffer = CircularBuffer(5, (), np.int32)
        for i in range(5):
            self.buffer.append(i)
        assert np.array_equal(self.buffer.__array__(), np.array(range(5)))
        assert len(self.buffer) == 5

        self.buffer.append(5)
        assert np.array_equal(self.buffer.__array__(), np.array(range(1, 6)))
        assert len(self.buffer) == 5

        for i in range(5, 10):
            self.buffer.append(i)
        assert np.array_equal(self.buffer.__array__(), np.array(range(5, 10)))
        assert len(self.buffer) == 5

    def test_get(self):
        self.buffer = CircularBuffer(5, (), np.int32)
        for i in range(10):
            self.buffer.append(i)
        print(self.buffer.__array__())
        assert np.array_equal(self.buffer.__array__(), np.array(range(5, 10)))
        assert len(self.buffer) == 5

        for idx, i in enumerate(range(5, 10)):
            assert self.buffer[idx] == i

예제 #2

파일 보기

class AtariEnvironment:
    num_actions = 18  # Use full action set

    def __init__(self, frame_shape, frame_postprocess=lambda x: x):
        self.ale = ALEInterface()
        self.ale.setBool(b"display_screen", cfg.display_screen)
        self.ale.setInt(b"frame_skip", 1)
        self.ale.setBool(b"color_averaging", False)
        self.ale.setInt(b"random_seed", cfg.random_seed)
        self.ale.setFloat(b"repeat_action_probability", cfg.sticky_prob)

        self.ale.loadROM(str.encode(cfg.rom))

        self.ale.setMode(cfg.mode)
        self.ale.setDifficulty(cfg.difficulty)

        self.action_set = self.ale.getLegalActionSet()
        assert len(self.action_set) == AtariEnvironment.num_actions

        screen_dims = tuple(reversed(self.ale.getScreenDims())) + (1,)
        self._frame_buffer = CircularBuffer(
            cfg.frame_buffer_size, screen_dims, np.uint8
        )
        self._frame_stack = CircularBuffer(
            cfg.frame_history_size, frame_shape, np.uint8
        )
        self._frame_postprocess = frame_postprocess

        self._episode_count = 0
        self.reset(inc_episode_count=False)

    def _is_terminal(self):
        return self.ale.game_over()

    def _get_single_frame(self):
        stacked_frames = np.concatenate(self._frame_buffer, axis=2)
        maxed_frame = np.amax(stacked_frames, axis=2)
        expanded_frame = np.expand_dims(maxed_frame, 3)
        frame = self._frame_postprocess(expanded_frame)

        return frame

    def reset(self, inc_episode_count=True):
        self._episode_frames = 0
        self._episode_reward = 0
        if inc_episode_count:
            self._episode_count += 1

        self.ale.reset_game()
        for _ in range(cfg.frame_buffer_size):
            self._frame_buffer.append(self.ale.getScreenGrayscale())
        for _ in range(cfg.frame_history_size):
            self._frame_stack.append(self._get_single_frame())

    def act(self, action):
        assert not self._is_terminal()

        cum_reward = 0
        for _ in range(cfg.frame_skip):
            cum_reward += self.ale.act(self.action_set[action])
            self._frame_buffer.append(self.ale.getScreenGrayscale())

        self._frame_stack.append(self._get_single_frame())
        self._episode_frames += cfg.frame_skip
        self._episode_reward += cum_reward
        cum_reward = np.clip(cum_reward, -1, 1)

        return cum_reward, self.state, self._is_terminal()

    @property
    def state(self):
        assert len(self._frame_buffer) == cfg.frame_buffer_size
        assert len(self._frame_stack) == cfg.frame_history_size
        return np.concatenate(self._frame_stack, axis=-1)

    @property
    def episode_reward(self):
        return self._episode_reward

    @property
    def episode_frames(self):
        return self._episode_frames

    @property
    def episode_steps(self):
        return self._episode_frames // cfg.frame_skip

    @property
    def episode_count(self):
        return self._episode_count