Python WorldModel.full_to_ac Examples

Programming Language: Python

Namespace/Package Name: world_model

Class/Type: WorldModel

Method/Function: full_to_ac

Examples at hotexamples.com: 1

Python WorldModel.full_to_ac - 1 examples found. These are the top rated real world Python examples of world_model.WorldModel.full_to_ac extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

WorldModel(15)

get_pose(7)

is_mission_running(4)

reward(4)

get_observation(4)

mission_complete(2)

load(2)

simulate(2)

agent_in_arena(2)

set_refbox_command(1)

set_friend_odom(1)

set_friend_goalie_id(1)

set_friend_color(1)

set_test_name(1)

set_existing_enemies_id(1)

set_enemy_odom(1)

set_blue_info(1)

set_yellow_info(1)

set_ball_odom(1)

teleport_to_point(1)

predict_next_state(1)

set_existing_friends_id(1)

is_kick_off_us(1)

kick_to(1)

get_absolute_coords(1)

align_neck_with_body(1)

angle_between_points(1)

ball_is_moving(1)

ball_kicked(1)

encode(1)

env_analogue(1)

full_to_ac(1)

get_distance_to_point(1)

add_entities(1)

get_entity(1)

get_nearest_opponent_to_point(1)

get_object_absolute_coords(1)

get_velocity(1)

initialize_world(1)

is_ball_kickable(1)

is_before_kick_off(1)

train_on_episodes(1)

Example #1

Show file

def train_model(model,
                curriculum,
                cfg,
                initial_episode=0,
                display=None,
                simulated=True,
                plot_stats=False,
                show_qsummary=False,
                stats_filename=None,
                max_lesson=None):
    reload_model = cfg('agent', 'reload_at_checkpoint', default=False)
    if not stats_filename:
        stats_filename = 'stats/' + model.name() + '.csv'
    stats_header = 'Lesson Number,Episode Number,Episode Reward,Episode Length'
    show_text_display = plot_stats or show_qsummary

    try:
        stats_data = np.genfromtxt(stats_filename,
                                   dtype=['int', 'int', 'float', 'float'],
                                   delimiter=',',
                                   names=True)[:initial_episode]
        rp_data = stats_data['Episode_Reward']
        lp_data = stats_data['Episode_Length']
        separators = np.where(np.diff(stats_data['Lesson_Number']))[0]
        np.savetxt(stats_filename,
                   stats_data,
                   fmt='%d,%d,%f,%f',
                   header=stats_header,
                   comments='')
        del stats_data
        new_file = False
    except (OSError, FileNotFoundError):  # File not found
        rp_data = []
        lp_data = []
        separators = []
        new_file = True

    if plot_stats:
        from display import LivePlot
        rp = LivePlot('Episode Reward during Training',
                      '# Episodes',
                      'Total Reward',
                      start_data=rp_data,
                      separators=separators)
        lp = LivePlot('Episode Length during Training',
                      '# Episodes',
                      'Length (s)',
                      start_data=lp_data,
                      separators=separators)
    del rp_data, lp_data, separators

    if show_qsummary:
        from display import QSummary
        from archetypes import StandardArchetypes, Archetype
        archs = StandardArchetypes(
            cfg('arena', 'width'),
            cfg('arena', 'height'),
            cfg('arena', 'length'),
        )
        if not cfg('agent', 'use_full_observation', default=True):
            from world_model import WorldModel
            lateral = (cfg('agent', 'observation_width') - 1) // 2
            vertical = (cfg('agent', 'observation_height') - 1) // 2
            obs_edge_type = cfg('agent', 'obs_edge_type', default='air')
            archs = [
                Archetype(
                    WorldModel.full_to_ac(arch.world, lateral, vertical,
                                          obs_edge_type), arch.name,
                    arch.optimal_action) for arch in archs
            ]
        qsummary = QSummary(archs, model)

    if show_text_display:
        from display import TextDisplay
        text_display = TextDisplay(
            {
                "Lesson #": (lambda: '{}'.format(curriculum.lesson_num())),
                "Episode #": (lambda: '{}'.format(curriculum.episode_num())),
                "Total Episodes": (lambda: '{}'.format(episode_num)),
                "Epsilon": (lambda: '{:.1f}%'.format(100 * model.epsilon())),
                "Pass Rate":
                (lambda: '{:.1f}%'.format(100 * curriculum.pass_rate()))
            },
            title=model.name())

    def reset_fn(*args, **kwargs):
        if reload_model:
            model.reload()
        model.reset_learning_params(*args, **kwargs)
        if plot_stats:
            rp.add_sep()
            lp.add_sep()

    last_reward = -np.inf
    episode_num = initial_episode
    action_delay = (0 if simulated else 0.2 /
                    cfg('training', 'overclock_factor'))
    save_frequency = cfg('training', 'save_frequency')

    model.reset_learning_params(num_episodes=curriculum.max_episodes(),
                                initial_episode=curriculum.episode_num())

    if show_text_display:
        text_display.update()

    with open(stats_filename, 'a') as stats_file:
        if new_file:
            print(stats_header, file=stats_file, flush=True)
        bp, start_pos, max_episode_time = curriculum.get_mission(
            last_reward, reset_fn, max_lesson=max_lesson)
        while bp is not None:
            episode_num += 1
            mission = Mission(blueprint=bp,
                              start_position=start_pos,
                              training=True,
                              action_delay=action_delay,
                              max_episode_time=max_episode_time,
                              simulated=simulated,
                              display=display)
            print('Lesson {}, Episode {}'.format(curriculum.lesson_num(),
                                                 episode_num))
            mission_stats = run_mission(model, mission, cfg)
            last_reward = mission_stats.reward
            print('Total reward   :', mission_stats.reward)
            print('Episode length :', mission_stats.length)
            if plot_stats:
                rp.add(mission_stats.reward)
                lp.add(mission_stats.length)
            if show_qsummary:
                qsummary.update()
            if show_text_display:
                text_display.update()

            print('{},{},{},{}'.format(curriculum.lesson_num(), episode_num,
                                       mission_stats.reward,
                                       mission_stats.length),
                  file=stats_file,
                  flush=True)
            if episode_num % save_frequency == 0:
                save_id = 'epoch_{:09d}'.format(episode_num)
                if reload_model:
                    model.reload(save_id)
                else:
                    model.save(save_id)
                curriculum.save(save_id)
            bp, start_pos, max_episode_time = curriculum.get_mission(
                last_reward, reset_fn, max_lesson=max_lesson)
        save_id = 'epoch_{:09d}'.format(episode_num)
        model.save(save_id)
        curriculum.save(save_id)

    if curriculum.is_completed() or (max_lesson is not None
                                     and curriculum.lesson_num() > max_lesson):
        print("Agent completed curriculum.")
    else:
        print('Agent was unable to complete curriculum lesson {}.'.format(
            curriculum.lesson_num()))

    if plot_stats:
        rp.close()
        lp.close()

    if show_qsummary:
        qsummary.close()

    if show_text_display:
        text_display.close()

    return episode_num