Python BatchEpisodes.log примеры использования

Язык программирования: Python

Пространство имен/Пакет: maml_rl.episode

Класс/Тип: BatchEpisodes

Метод/Функция: log

Примеров на hotexamples.com: 2

Python BatchEpisodes.log - 2 примера найдено. Это лучшие примеры Python кода для maml_rl.episode.BatchEpisodes.log, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

BatchEpisodes(19)

append(17)

compute_advantages(2)

log(2)

extend_episodes(1)

gae(1)

Пример #1

Показать файл

Файл: multi_task_sampler_multi_serial_test1.py Проект: tyliu22/pytorch-meta-rl-PAC-Bayes

    def create_episodes(self,
                        gamma=0.95,
                        gae_lambda=1.0,
                        device='cpu'):
        # 初始化 episodes，用于保存 完整的轨迹数据
        # 将sample_trajectories函数采样 batch_size 个完整的轨迹保存至 episodes
        episodes = BatchEpisodes(batch_size=self.batch_size,
                                 gamma=gamma,
                                 device=device)
        episodes.log('_createdAt', datetime.now(timezone.utc))
        # episodes.log('process_name', self.name)

        #
        t0 = time.time()
        """
        ******************************************************************
        """
        for item in self.sample_trajectories():
            episodes.append(*item)
        episodes.log('duration', time.time() - t0)

        self.baseline.fit(episodes)
        episodes.compute_advantages(self.baseline,
                                    gae_lambda=gae_lambda,
                                    normalize=True)
        return episodes

Пример #2

Показать файл

Файл: multi_task_sampler.py Проект: dkkim93/pytorch-maml-rl

    def create_episodes(self, params=None, gamma=0.95, gae_lambda=1.0, device='cpu'):
        episodes = BatchEpisodes(batch_size=self.batch_size, gamma=gamma, device=device)
        episodes.log('_createdAt', datetime.now(timezone.utc))
        episodes.log('process_name', self.name)

        t0 = time.time()
        for item in self.sample_trajectories(params=params):
            episodes.append(*item)
        episodes.log('duration', time.time() - t0)

        self.baseline.fit(episodes)
        episodes.compute_advantages(self.baseline, gae_lambda=gae_lambda, normalize=True)
        return episodes