Python RNNCriticReplayPool示例

编程语言: Python

命名空间/包名称: sandbox.gkahn.gcg.sampler.replay_pool

hotexamples.com的示例: 6

Python RNNCriticReplayPool - 已找到6个示例。这些是从开源项目中提取的最受好评的sandbox.gkahn.gcg.sampler.replay_pool.RNNCriticReplayPool现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

log_pools(2)

RNNCriticReplayPool(1)

get_recent_paths_pools(1)

sample_pools(1)

statistics_pools(1)

示例#1

显示文件

文件： sampler.py 项目： vickyskarthik/gcg

    def __init__(self,
                 policy,
                 env,
                 n_envs,
                 replay_pool_size,
                 max_path_length,
                 sampling_method,
                 save_rollouts=False,
                 save_rollouts_observations=True,
                 save_env_infos=False,
                 env_str=None,
                 replay_pool_params={}):
        self._policy = policy
        self._n_envs = n_envs

        assert (self._n_envs == 1)  # b/c policy reset

        self._replay_pools = [
            RNNCriticReplayPool(
                env.spec,
                env.horizon,
                policy.N,
                policy.gamma,
                replay_pool_size // n_envs,
                obs_history_len=policy.obs_history_len,
                sampling_method=sampling_method,
                save_rollouts=save_rollouts,
                save_rollouts_observations=save_rollouts_observations,
                save_env_infos=save_env_infos,
                replay_pool_params=replay_pool_params) for _ in range(n_envs)
        ]

        try:
            envs = [
                pickle.loads(pickle.dumps(env)) for _ in range(self._n_envs)
            ] if self._n_envs > 1 else [env]
        except:
            envs = [create_env(env_str) for _ in range(self._n_envs)
                    ] if self._n_envs > 1 else [env]
        ### need to seed each environment if it is GymEnv
        seed = get_seed()
        if seed is not None and isinstance(utils.inner_env(env), GymEnv):
            for i, env in enumerate(envs):
                utils.inner_env(env).env.seed(seed + i)
        self._vec_env = VecEnvExecutor(envs=envs,
                                       max_path_length=max_path_length)
        self._curr_observations = self._vec_env.reset()

示例#2

显示文件

 def statistics(self):
     return RNNCriticReplayPool.statistics_pools(self._replay_pools)

示例#3

显示文件

 def get_recent_paths(self):
     return RNNCriticReplayPool.get_recent_paths_pools(self._replay_pools)

示例#4

显示文件

 def log(self, prefix=''):
     RNNCriticReplayPool.log_pools(self._replay_pools, self._nb_target_lost, prefix=prefix)

示例#5

显示文件

 def sample(self, batch_size):
     return RNNCriticReplayPool.sample_pools(self._replay_pools, batch_size,
                                             only_completed_episodes=self._policy.only_completed_episodes)

示例#6

显示文件

文件： sampler.py 项目： vickyskarthik/gcg

 def log(self, prefix=''):
     RNNCriticReplayPool.log_pools(self._replay_pools, prefix=prefix)