Python preprocess_frame示例

编程语言: Python

命名空间/包名称: mushroom_rl.utils.frames

方法/功能: preprocess_frame

hotexamples.com的示例: 4

Python preprocess_frame - 已找到4个示例。这些是从开源项目中提取的最受好评的mushroom_rl.utils.frames.preprocess_frame现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

    def step(self, action):
        action = action[0]

        # Force FIRE action to start episodes in games with lives
        if self._force_fire:
            obs, _, _, _ = self.env.env.step(1)
            self._force_fire = False
        while self._current_no_op > 0:
            obs, _, _, _ = self.env.env.step(0)
            self._current_no_op -= 1

        obs, reward, absorbing, info = self.env.step(action)
        self._real_reset = absorbing

        if info['lives'] != self._lives:
            if self._episode_ends_at_life:
                absorbing = True
            self._lives = info['lives']
            self._force_fire = self.env.unwrapped.get_action_meanings(
            )[1] == 'FIRE'

        self._state.append(preprocess_frame(obs, self._img_size))

        return LazyFrames(list(self._state),
                          self._history_length), reward, absorbing, info

示例#2

显示文件

 def reset(self, state=None):
     self._state = preprocess_frame(self.env.reset(), self._img_size)
     self._state = deque([deepcopy(
         self._state) for _ in range(self._history_length)],
         maxlen=self._history_length
     )
     return LazyFrames(list(self._state), self._history_length)

示例#3

显示文件

    def step(self, action):
        obs, reward, absorbing, info = self.env.step(action)
        reward *= 1. # Int to float
        if reward > 0:
            reward = 1. # MiniGrid discounts rewards based on timesteps, but we need raw rewards

        self._state.append(preprocess_frame(obs, self._img_size))

        return LazyFrames(list(self._state),
                          self._history_length), reward, absorbing, info

示例#4

显示文件

    def reset(self, state=None):
        if self._real_reset:
            self._state = preprocess_frame(self.env.reset(), self._img_size)
            self._state = deque(
                [deepcopy(self._state) for _ in range(self._history_length)],
                maxlen=self._history_length)
            self._lives = self._max_lives

        self._force_fire = self.env.unwrapped.get_action_meanings(
        )[1] == 'FIRE'

        self._current_no_op = np.random.randint(self._max_no_op_actions + 1)

        return LazyFrames(list(self._state), self._history_length)