Example #1
0
    def _thunk():
        env = gym.make(env_id)
        env = env_wrapper.NoopResetEnv(env, noop_max=30)
        env = env_wrapper.MaxAndSkipEnv(env, skip=4)
        env.seed(rand_seed + rank)
        env = env_wrapper.EpisodicLifeEnv(env)

        if "FIRE" in env.unwrapped.get_action_meanings():
            env = env_wrapper.FireResetEnv(env)

        env = env_wrapper.WarpFrame(env)
        env = env_wrapper.ClipRewardEnv(env)

        return env
Example #2
0
parser = argparse.ArgumentParser()
parser.add_argument("--env", default="BreakoutNoFrameskip-v4")
args = parser.parse_args()

#Parameters
#----------------------------
n_stack = 4
env_id = args.env
save_dir = "./save_" + env_id

#Create multiple environments
#----------------------------
env = gym.make(env_id)
env = env_wrapper.NoopResetEnv(env, noop_max=30)
env = env_wrapper.MaxAndSkipEnv(env, skip=4)
env = env_wrapper.EpisodicLifeEnv(env)

if "FIRE" in env.unwrapped.get_action_meanings():
    env = env_wrapper.FireResetEnv(env)

env = env_wrapper.WarpFrame(env)
env = env_wrapper.FrameStack(env, n_stack)

a_dim = env.action_space.n
img_height, img_width, c_dim = env.observation_space.shape

#Create the model
#----------------------------
config = tf.ConfigProto()
config.gpu_options.allow_growth = True
sess = tf.Session(config=config)