Python get_turtleの例、baselines.common.atari_wrappers.get_turtle Pythonの例

コード例 #1

0

ファイルを表示

ファイル: plot_enemy_dist_exp.py プロジェクト: KDL-umass/saliency_maps

def get_dist(history, env, model):
    distances = []

    for i in range(len(history['state_json'])):
        state_json = history['state_json'][i]
        distance = []

        turtle = atari_wrappers.get_turtle(env)
        tb = turtle.toybox
        tb.write_state_json(state_json)

        enemies = state_json['enemies']
        player_index = (state_json['player']['position']['x'],
                        state_json['player']['position']['y'])
        player_pos = world_to_pixels(player_index, tb)
        # print('player pos', player_pos)

        for enemy in enemies:
            # print(enemy)
            enemy_index = (enemy['position']['x'], enemy['position']['y'])
            enemy_pos = world_to_pixels(enemy_index, tb)
            # print('enemy pos', enemy_pos)
            distance.append(
                abs(player_pos[0] - enemy_pos[0]) +
                abs(player_pos[1] - enemy_pos[1]))

        distances += [distance]

    return distances

コード例 #2

0

ファイルを表示

ファイル: regress.py プロジェクト: charudatta10/Toybox-1

def main():
    arg_parser = common_arg_parser()
    args, unknown_args = arg_parser.parse_known_args()
    extra_args = parse_cmdline_kwargs(unknown_args)

    logger.configure()

    model, env = train(args, extra_args)
    env.close()

    logger.log("Running trained model")
    env = build_env(args, extra_args)
    obs = env.reset()
    turtle = atari_wrappers.get_turtle(env)
    scores = []
    session_scores = set()
    num_games = 0
    # This is a hack to get the starting screen, which throws an error in ALE for amidar
    num_steps = -1

    while num_games < 10:
        actions = model.step(obs)[0]
        num_lives = turtle.ale.lives()
        obs, _, done, info = env.step(actions)
        #done = done and (num_lives == 1 or turtle.ale.game_over())
        #time.sleep(1.0/60.0)
        done = num_lives == 1 and done 
        #done = done.any() if isinstance(done, np.ndarray) else done

        # Make regression testing faster by limiting score.
        # If we earn 500 or so points in any game, we can assume that we've learned something useful.
        if turtle.ale.get_score() > 500:
            done = True

        if isinstance(info, list) or isinstance(info, tuple):
            session_scores.add(np.average([d['score'] for d in info]))
        elif isinstance(info, dict):
            session_scores.add(['score'])
        else:
            session_scores.add(-1)

        if done:
            num_games += 1
            score = max(session_scores)
            scores.append(score)
            session_scores = set()

            print("game %s: %s" % (num_games, score))
            obs = env.reset()
            session_scores = set()


    print("Avg score: %f" % np.average(scores))
    print("Median score: %f" % np.median(scores))
    print("Std error score: %f" % sem(scores))
    print("Std dev score: %f" % stdev(scores))
    env.close()

    # Fail regression test if average is not greater than 100.
    if (np.average(scores) < 50):
        sys.exit(-1)

コード例 #3

0

ファイルを表示

ファイル: plot_enemy_dist_exp.py プロジェクト: KDL-umass/saliency_maps

def get_enemy_saliency(history, env, model, saliency_method):
    saliency = []

    for i in range(len(history['state_json'])):
        print(i)
        state_json = history['state_json'][i]
        frame = history['color_frame'][i]

        #get enemy pixels
        turtle = atari_wrappers.get_turtle(env)
        tb = turtle.toybox
        tb.write_state_json(state_json)
        enemy_pixels = get_concept_pixels_amidar(
            'enemies', state_json, [frame.shape[1], frame.shape[0]], tb)

        #get saliency for each enemy
        #save in right format
        saliency_i = []
        if saliency_method == 'perturbation':
            actor_saliency = score_frame(model,
                                         history,
                                         i,
                                         r=2,
                                         d=5,
                                         interp_func=occlude,
                                         mode='actor')
            S = np.zeros((110, 84))
            S[18:102, :] = actor_saliency
            S = imresize(actor_saliency,
                         size=[frame.shape[0], frame.shape[1]],
                         interp='bilinear').astype(np.float32)

            for enemy in enemy_pixels:
                saliency_enemy_i = []
                for pixels in enemy:
                    saliency_enemy_i.append(S[pixels[1]][pixels[0]])
                saliency_i += [np.mean(saliency_enemy_i)]
            saliency += [saliency_i]
        elif saliency_method == 'object':
            for enemy in enemy_pixels:
                saliency_enemy_i = score_frame_by_pixels(model,
                                                         history,
                                                         i,
                                                         enemy,
                                                         mode='actor')
                saliency_i += [saliency_enemy_i]
            saliency += [saliency_i]
        elif saliency_method == 'jacobian':
            actor_saliency = get_gradients(model,
                                           history['ins'][i],
                                           mode='actor')
            S = np.zeros((110, 84))
            S[18:102, :] = actor_saliency[0, :, :, 3]**2
            S = imresize(actor_saliency[0, :, :, 3]**2,
                         size=[frame.shape[0], frame.shape[1]],
                         interp='bilinear').astype(np.float32)

            for enemy in enemy_pixels:
                saliency_enemy_i = []
                for pixels in enemy:
                    saliency_enemy_i.append(S[pixels[1]][pixels[0]])
                saliency_i += [np.mean(saliency_enemy_i)]
            print(saliency_i)
            saliency += [saliency_i]

    return saliency

コード例 #4

0

ファイルを表示

def run_experiment(history, saliency_method='perturbation'):
    print("Setting up trained model")
    env, model = setUp(
        "AmidarToyboxNoFrameskip-v4", "a2c",
        "./models/AmidarToyboxNoFrameskip-v4/amidar4e7_a2c.model")
    env.reset()
    turtle = atari_wrappers.get_turtle(env)
    tb = turtle.toybox

    saliency_score = {0: {-2:[], -4:[], 0:[], 4:[], 2:[]}, 1: {-2:[], -4:[], 0:[], 4:[], 2:[]}, \
                    2: {-2:[], -4:[], 0:[], 4:[], 2:[]}, 3: {-2:[], -4:[], 0:[], 4:[], 2:[]}, \
                    4: {-2:[], -4:[], 0:[], 4:[], 2:[]}}
    distances = {0: {-2:[], -4:[], 0:[], 4:[], 2:[]}, 1: {-2:[], -4:[], 0:[], 4:[], 2:[]}, \
                    2: {-2:[], -4:[], 0:[], 4:[], 2:[]}, 3: {-2:[], -4:[], 0:[], 4:[], 2:[]}, \
                    4: {-2:[], -4:[], 0:[], 4:[], 2:[]}}

    for i in range(125, len(history['state_json'])):
        state_json = history['state_json'][i]
        frame = history['color_frame'][i]

        #set state to the same state as original game
        tb.write_state_json(state_json)
        enemy_pixels = get_concept_pixels_amidar(
            'enemies', state_json, [frame.shape[1], frame.shape[0]], tb)

        #get saliency
        # S = get_saliency(history, model, i, frame)

        #intervene for each enemy is saliency > 0
        for j, enemy in enumerate(enemy_pixels):
            tb.write_state_json(state_json)
            saliency_orig = get_saliency_on_enemy(
                history,
                model,
                i,
                frame,
                enemy,
                saliency_method=saliency_method)

            if saliency_orig > 0:
                dist_orig = get_dist(state_json, tb, j)

                for k in [-8, -6, 0, 2, 4]:
                    tb.write_state_json(state_json)
                    new_state_json, new_color_frame, new_obs = intervention_move_enemy(
                        state_json, env, model, tb, j, move_step=k)

                    if new_state_json is None:
                        continue

                    if k == 0:
                        saliency_score[j][0].append(saliency_orig)
                        distances[j][0].append(dist_orig)
                        continue

                    plt.imshow(frame)
                    plt.savefig(SAVE_DIR + 'frame{}_e{}'.format(i, j))
                    plt.imshow(new_color_frame)
                    plt.savefig(SAVE_DIR +
                                'frame{}_e{}_intervene{}'.format(i, j, k))

                    saliency = get_saliency_on_enemy(
                        history,
                        model,
                        i,
                        new_color_frame,
                        enemy,
                        inp=new_obs,
                        saliency_method=saliency_method)
                    dist = get_dist(new_state_json, tb, j)

                    if k == -6 or k == -8:
                        saliency_score[j][k + 4].append(saliency)
                        distances[j][k + 4].append(dist)
                    else:
                        saliency_score[j][k].append(saliency)
                        distances[j][k].append(dist)

    return saliency_score, distances

コード例 #5

0

ファイルを表示

def main():
    # configure logger, disable logging in child MPI processes (with rank > 0)

    arg_parser = common_arg_parser()
    args, unknown_args = arg_parser.parse_known_args()
    extra_args = parse_cmdline_kwargs(unknown_args)

    if MPI is None or MPI.COMM_WORLD.Get_rank() == 0:
        rank = 0
        logger.configure()
    else:
        logger.configure(format_strs=[])
        rank = MPI.COMM_WORLD.Get_rank()

    model, env = train(args, extra_args)
    env.close()

    if args.save_path is not None and rank == 0:
        save_path = osp.expanduser(args.save_path)
        model.save(save_path)

    if args.play:
        logger.log("Running trained model")
        env = build_env(args, extra_args)
        obs = env.reset()
        turtle = atari_wrappers.get_turtle(env)
        scores = []
        session_scores = set()
        num_games = 0
        # This is a hack to get the starting screen, which throws an error in ALE for amidar
        num_steps = -1

        while num_games < 100:
            actions = model.step(obs)[0]
            num_lives = turtle.ale.lives()
            obs, _, done, info = env.step(actions)
            #done = done and (num_lives == 1 or turtle.ale.game_over())
            #env.render()
            #time.sleep(1.0/60.0)
            done = num_lives == 1 and done
            #done = done.any() if isinstance(done, np.ndarray) else done

            if isinstance(info, list) or isinstance(info, tuple):
                session_scores.add(np.average([d['score'] for d in info]))
            elif isinstance(info, dict):
                session_scores.add(['score'])
            else:
                session_scores.add(-1)

            if done:
                num_games += 1
                score = max(session_scores)
                scores.append(score)
                session_scores = set()

                print("game %s: %s" % (num_games, score))
                obs = env.reset()
                session_scores = set()

        print("Avg score: %f" % np.average(scores))
        print("Median score: %f" % np.median(scores))
        print("Std error score: %f" % sem(scores))
        print("Std dev score: %f" % stdev(scores))
        env.close()

コード例 #6

0

ファイルを表示