Python ppo_atari_base示例

编程语言: Python

命名空间/包名称: tensor2tensor.models.research.rl

方法/功能: ppo_atari_base

hotexamples.com的示例: 2

Python ppo_atari_base - 已找到2个示例。这些是从开源项目中提取的最受好评的tensor2tensor.models.research.rl.ppo_atari_base现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： gym_problems.py 项目： raphael-sch/tensor2tensor

    def __init__(self, *args, **kwargs):
        super(GymDiscreteProblemWithAgent, self).__init__(*args, **kwargs)
        self._env = None
        self.debug_dump_frames_path = "debug_frames_env"
        self.make_extra_debug_info = True

        # defaults
        self.environment_spec = lambda: gym.make(self.env_name)
        self.real_env = self.environment_spec()
        self.in_graph_wrappers = []
        self.collect_hparams = rl.ppo_atari_base()
        self.settable_num_steps = 20000
        self.simulated_environment = None
        self.warm_up = 10  # TODO(piotrm): This should be probably removed.

示例#2

显示文件

  def __init__(self, *args, **kwargs):
    super(GymDiscreteProblemWithAgent, self).__init__(*args, **kwargs)
    self._env = None
    self.debug_dump_frames_path = "debug_frames_env"
    self.make_extra_debug_info = True
    self.autoencoder_model = None

    # Defaults.
    self.environment_spec = lambda: gym.make(self.env_name)
    self.real_env = self.environment_spec()
    self.in_graph_wrappers = []
    self.collect_hparams = rl.ppo_atari_base()
    self.settable_num_steps = 20000
    self.simulated_environment = None
    self.warm_up = 10  # TODO(piotrm): This should be probably removed.

    # Debug info.
    self.dones = 0
    self.real_reward = 0
    self.real_env.reset()
    self.total_sim_reward, self.total_real_reward = 0.0, 0.0
    self.sum_of_rewards = 0.0
    self.successful_episode_reward_predictions = 0