Python wrap_dqn 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: tf2rl.envs.atari_wrapper

메소드/함수: wrap_dqn

hotexamples.com에서의 예제들: 3

Python wrap_dqn - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 tf2rl.envs.atari_wrapper.wrap_dqn에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

    def test_wrap_dqn(self):
        env = wrap_dqn(gym.make("SpaceInvadersNoFrameskip-v4"),
                       wrap_ndarray=True)

        obs = env.reset()
        self.assertEqual(type(obs), np.ndarray)
        self.assertEqual(obs.shape, (84, 84, 4))

예제 #2

파일 보기

파일: run_dqn_atari.py 프로젝트: zw199502/tf2rl

if __name__ == '__main__':
    parser = Trainer.get_argument()
    parser = DQN.get_argument(parser)
    parser.add_argument('--env-name',
                        type=str,
                        default="SpaceInvadersNoFrameskip-v4")
    parser.set_defaults(episode_max_steps=108000)
    parser.set_defaults(test_interval=10000)
    parser.set_defaults(max_steps=int(1e9))
    parser.set_defaults(save_model_interval=500000)
    parser.set_defaults(gpu=0)
    parser.set_defaults(show_test_images=True)
    parser.set_defaults(memory_capacity=int(1e6))
    args = parser.parse_args()

    env = wrap_dqn(gym.make(args.env_name))
    test_env = wrap_dqn(gym.make(args.env_name), reward_clipping=False)
    # Following parameters are equivalent to DeepMind DQN paper
    # https://www.nature.com/articles/nature14236
    policy = DQN(
        enable_double_dqn=args.enable_double_dqn,
        enable_dueling_dqn=args.enable_dueling_dqn,
        enable_noisy_dqn=args.enable_noisy_dqn,
        state_shape=env.observation_space.shape,
        action_dim=env.action_space.n,
        lr=0.0000625,  # This value is from Rainbow
        adam_eps=1.5e-4,  # This value is from Rainbow
        n_warmup=50000,
        target_replace_interval=10000,
        batch_size=32,
        memory_capacity=args.memory_capacity,

예제 #3

파일 보기

파일: run_sac_discrete.py 프로젝트: cambel/tf2rl

    test_env = gym.make(args.env_name)

    if is_atari_env(env):
        # Parameters come from Appendix.B in original paper.
        # See https://arxiv.org/abs/1910.07207
        parser.set_defaults(episode_max_steps=108000)
        parser.set_defaults(test_interval=int(1e5))
        parser.set_defaults(show_test_images=True)
        parser.set_defaults(max_steps=int(1e9))
        parser.set_defaults(target_update_interval=8000)
        parser.set_defaults(n_warmup=int(2e4))
        args = parser.parse_args()
        if args.gpu == -1:
            print("Are you sure you're trying to solve Atari without GPU?")

        env = wrap_dqn(env, wrap_ndarray=True)
        test_env = wrap_dqn(test_env, wrap_ndarray=True, reward_clipping=False)
        policy = SACDiscrete(
            state_shape=env.observation_space.shape,
            action_dim=env.action_space.n,
            discount=0.99,
            critic_fn=AtariQFunc,
            actor_fn=AtariCategoricalActor,
            lr=3e-4,
            memory_capacity=args.memory_capacity,
            batch_size=64,
            n_warmup=args.n_warmup,
            update_interval=4,
            target_update_interval=args.target_update_interval,
            auto_alpha=args.auto_alpha,
            gpu=args.gpu)