def _thunk(): env = gym.make(env_id) env = env_wrapper.NoopResetEnv(env, noop_max=30) env = env_wrapper.MaxAndSkipEnv(env, skip=4) env.seed(rand_seed + rank) env = env_wrapper.EpisodicLifeEnv(env) if "FIRE" in env.unwrapped.get_action_meanings(): env = env_wrapper.FireResetEnv(env) env = env_wrapper.WarpFrame(env) env = env_wrapper.ClipRewardEnv(env) return env
parser = argparse.ArgumentParser() parser.add_argument("--env", default="BreakoutNoFrameskip-v4") args = parser.parse_args() #Parameters #---------------------------- n_stack = 4 env_id = args.env save_dir = "./save_" + env_id #Create multiple environments #---------------------------- env = gym.make(env_id) env = env_wrapper.NoopResetEnv(env, noop_max=30) env = env_wrapper.MaxAndSkipEnv(env, skip=4) env = env_wrapper.EpisodicLifeEnv(env) if "FIRE" in env.unwrapped.get_action_meanings(): env = env_wrapper.FireResetEnv(env) env = env_wrapper.WarpFrame(env) env = env_wrapper.FrameStack(env, n_stack) a_dim = env.action_space.n img_height, img_width, c_dim = env.observation_space.shape #Create the model #---------------------------- config = tf.ConfigProto() config.gpu_options.allow_growth = True sess = tf.Session(config=config)