Python make_atari примеры использования

Язык программирования: Python

Пространство имен/Пакет: pfrl.wrappers.atari_wrappers

Метод/Функция: make_atari

Примеров на hotexamples.com: 6

Python make_atari - 6 примеров найдено. Это лучшие примеры Python кода для pfrl.wrappers.atari_wrappers.make_atari, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

def wrap_env(env_id, max_frames=5000, clip_rewards=True, episode_life=True):
    if env_id.startswith('MiniGrid'):
        env = mini_grid_wrapper(
            env_id, max_frames=max_frames, clip_rewards=True)
    elif env_id.startswith('GDY'):
        env = griddly_wrapper(
            env_id, max_frames=max_frames, clip_rewards=True)
    else:
        env = atari_wrappers.wrap_deepmind(atari_wrappers.make_atari(
            env_id, max_frames=max_frames), episode_life=True, clip_rewards=True)
    return env

Пример #2

Показать файл

Файл: train_a3c.py Проект: lin826/pfrl

 def make_env(process_idx, test):
     # Use different random seeds for train and test envs
     process_seed = process_seeds[process_idx]
     env_seed = 2**31 - 1 - process_seed if test else process_seed
     env = atari_wrappers.wrap_deepmind(
         atari_wrappers.make_atari(args.env, max_frames=args.max_frames),
         episode_life=not test,
         clip_rewards=not test,
     )
     env.seed(int(env_seed))
     if args.monitor:
         env = pfrl.wrappers.Monitor(
             env, args.outdir, mode="evaluation" if test else "training")
     if args.render:
         env = pfrl.wrappers.Render(env)
     return env

Пример #3

Показать файл

 def make_env(test):
     # Use different random seeds for train and test envs
     env_seed = test_seed if test else train_seed
     env = atari_wrappers.wrap_deepmind(
         atari_wrappers.make_atari(args.env, max_frames=args.max_frames),
         episode_life=not test,
         clip_rewards=not test,
     )
     env.seed(int(env_seed))
     if test:
         # Randomize actions like epsilon-greedy in evaluation as well
         env = pfrl.wrappers.RandomizeAction(env, args.eval_epsilon)
     if args.monitor:
         env = pfrl.wrappers.Monitor(
             env, args.outdir, mode="evaluation" if test else "training")
     if args.render:
         env = pfrl.wrappers.Render(env)
     return env

Пример #4

Показать файл

Файл: train_dqn_batch_ale.py Проект: pfnet/pfrl

 def make_env(idx, test):
     # Use different random seeds for train and test envs
     process_seed = int(process_seeds[idx])
     env_seed = 2**32 - 1 - process_seed if test else process_seed
     env = atari_wrappers.wrap_deepmind(
         atari_wrappers.make_atari(args.env, max_frames=args.max_frames),
         episode_life=not test,
         clip_rewards=not test,
         frame_stack=False,
     )
     if test:
         # Randomize actions like epsilon-greedy in evaluation as well
         env = pfrl.wrappers.RandomizeAction(env, args.eval_epsilon)
     env.seed(env_seed)
     if args.monitor:
         env = pfrl.wrappers.Monitor(
             env, args.outdir, mode="evaluation" if test else "training")
     if args.render:
         env = pfrl.wrappers.Render(env)
     return env

Пример #5

Показать файл

Файл: pfrl_rnn.py Проект: jfrancis71/PyGenBrix

    get_packed_sequence_info,
    unwrap_packed_sequences_recursive,
    wrap_packed_sequences_recursive,
)

logging.basicConfig(level=20)

ap = argparse.ArgumentParser(description="pfrl RNN DQN")
ap.add_argument("--model")
ap.add_argument("--demo", action="store_true")
ap.add_argument("--sleep", default=.02, type=float)
ap.add_argument("--env", default="PongNoFrameskip-v4")
ap.add_argument("--steps", default=1e7, type=int)
ns = ap.parse_args()

env = atari_wrappers.wrap_deepmind(atari_wrappers.make_atari(ns.env,
                                                             max_frames=10000),
                                   episode_life=True,
                                   clip_rewards=True,
                                   frame_stack=False)
test_env = atari_wrappers.wrap_deepmind(atari_wrappers.make_atari(
    ns.env, max_frames=10000),
                                        episode_life=False,
                                        clip_rewards=False,
                                        frame_stack=False)


class MyNetwork(nn.Module):
    def __init__(self):
        super().__init__()
        self.l1 = nn.Conv2d(1, 32, 8, stride=4)
        self.l2 = nn.ReLU()

Пример #6

Показать файл

Файл: dqn.py Проект: jfrancis71/PyGenBrix

import gym
from stable_baselines3 import DQN
from pfrl.wrappers import atari_wrappers

ap = argparse.ArgumentParser(description="DQN")
ap.add_argument("--env", default="PongNoFrameskip-v4")
ap.add_argument("--frame_stacks", default=4)
ap.add_argument("--learning_starts", default=100000, type=int)
ap.add_argument("--total_timesteps", default=1000000, type=int)
ap.add_argument("--save_path")
ap.add_argument("--tensorboard_log")
ns = ap.parse_args()

env = atari_wrappers.wrap_deepmind(
    atari_wrappers.make_atari(ns.env, max_frames=10000),
    episode_life=True,
    clip_rewards=True,
)
model = DQN('CnnPolicy',
            env,
            verbose=1,
            buffer_size=10000,
            learning_rate=.0001,
            learning_starts=ns.learning_starts,
            target_update_interval=1000,
            tensorboard_log=ns.tensorboard_log)
model.learn(total_timesteps=ns.total_timesteps)
if ns.save_path is not None:
    model.save(ns.save_path)