Python Experiment._run 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: experiment

클래스/타입: Experiment

메소드/함수: _run

hotexamples.com에서의 예제들: 1

Python Experiment._run - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 experiment.Experiment._run에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Experiment(30)

__init__(14)

_last_instance(8)

compare(6)

add_tx(6)

add_grad(6)

doTest(3)

add_config_file(3)

DiscountedReturn(3)

add_chart(3)

analyse(3)

add_init_net_snapshot(2)

add_log(2)

case_prefix(2)

_walk_cases(2)

add_plot(2)

close_log_file(2)

SVD(2)

begin_experiment(2)

doEpisode(2)

collectLatticeLogs(1)

cnt_id(1)

compile(1)

close(1)

compute_explo(1)

clean_logs(1)

ConvertDataTob64String(1)

doEpisodeWithMemory(1)

foo(1)

get_control_result(1)

get_experiment_result(1)

makedir(1)

matches(1)

pause(1)

perform(1)

resume(1)

run_exp(1)

slaves(1)

start_game(1)

wait(1)

check_speicalpoint(1)

apply_lr(1)

calculate(1)

add_monitored_vars(1)

FixedConflictWorkload(1)

OutstandingReqArrivalRate(1)

PoissonArrivalRate(1)

ZipfianWorkload(1)

_get_model(1)

_oneInteraction(1)

예제 #1

파일 보기

파일: main.py 프로젝트: isaachenrion/phone-a-friend

def main():
    '''LOAD FRIENDS'''
    active_sensors = [None] * args.batch_size
    subordinates_batch = [None] * args.batch_size
    for idx in range(args.batch_size):
        subordinates = {}
        if args.use_subordinates:
            model_strs = []
            model_strs.append('Mar-27___12-12-19-RandomPear-recurrent') # BAD PEAR
            #model_strs.append('Mar-24___16-14-48-RandomPear-recurrent') # GOOD PEAR
            for s in model_strs:
                subordinates[s] = Subordinate(s)
                if idx == 0:
                    print("Loaded subordinate: {}".format(s))
        num_subordinates = len(subordinates)
        if num_subordinates > 0:
            subordinates_batch[idx] = subordinates

        policy_sensors = []
        if args.use_policy_sensors:
            model_strs = []
            #model_strs.append('Mar-23___14-33-50-RandomPear-recurrent') # BAD PEAR
            model_strs.append('Mar-24___16-14-48-RandomPear-recurrent') # GOOD PEAR
            for s in model_strs:
                policy_sensors.append(PolicySensor(s))
                if idx == 0:
                    print("Loaded policy sensor: {}".format(s))

        reward_sensors = []
        if args.use_reward_sensors:
            reward_strs = ['pear', 'orange', 'apple']
            for s in reward_strs:
                reward_sensors.append(RewardSensor(s))
                if idx == 0:
                    print("Loaded reward sensor: {}".format(s))

        if idx == 0:
            num_active_sensors = len(policy_sensors) + len(reward_sensors)
            print("Total number of active sensors: {}".format(num_active_sensors))
        if num_active_sensors > 0:
            active_sensors[idx] = policy_sensors + reward_sensors

    ''' LOAD ENVIRONMENTS '''
    print("Creating %d environments" % args.batch_size)
    from environments.maze.env_list import ENVS
    Env = ENVS[args.env]
    print("Environment: {}".format(Env.__name__))

    #allowed_actions = range(MC.NUM_BASIC_ACTIONS + num_active_sensors + num_subordinates)
    policy_dict = {}
    model_strs = []
    #model_strs.append('Mar-23___14-33-50-RandomPear-recurrent') # BAD PEAR
    #model_strs.append('Mar-27___14-26-20-RandomPear-recurrent') # GOOD PEAR

    for s in model_strs:
        print("Loading model: {}".format(s))
        filename = os.path.join(C.WORKING_DIR, 'experiments', s, s + '.ckpt')
        model = RecurrentModel(1, torch.load(filename), filename)
        policy_dict[s] = DiscreteModelPolicy(model, stochastic=True, baseline_model=None, batch_size=args.batch_size)

    envs=[Env(active_sensors=active_sensors[idx], subordinates=model_strs, seed=idx) for idx in range(args.batch_size)]

    A = envs[0].action_space.n
    action_types = envs[0].world.agent.action_types
    goal_state = envs[0].reward.goal_state
    try:
        E = sum([sensor.shape for sensor in envs[0].world.agent.sensors])

    except TypeError:
        E = None

    print("Total sensor size: {}".format(E))
    state_size_dict = envs[0].world.state_size_dict

    print("Number of Actions is: {}".format(A))

    ''' BUILD MODEL '''

    if args.multiprocessing:
        bs = 1
    else: bs = args.batch_size

    baseline_net = RecurrentNet2(input_size_dict=state_size_dict, hidden_size=20, action_types=["value"], softmax=False, bn=args.bn, wn=args.wn)
    baseline_model = RecurrentModel(bs, baseline_net)
    #baseline_model= None

    _action_net = RecurrentNet2(hidden_size=50, input_size_dict=state_size_dict, action_types=action_types, goal_state=goal_state, bn=args.bn, wn=args.wn)
    _action_model = RecurrentModel(bs, _action_net)


    if args.load is not None:
        print("Loading model: {}".format(args.load))
        filename = os.path.join(C.WORKING_DIR, 'experiments', args.load, args.load + '.ckpt')
        _action_net = torch.load(filename)

        _action_model = RecurrentModel(1, _action_net, filename)

    if MC.EXPERIMENTAL and False:
        policy = DiscreteModelPolicy(_action_model, stochastic=True, baseline_model=baseline_model)
        policy_dict["main_policy"] = policy
        policy = CollectionOfPolicies(policy_dict, envs)
    else:
        action_model = _action_model
        policy = DiscreteModelPolicy(action_model, stochastic=True, baseline_model=baseline_model)


    print("Action model: {}".format(_action_net))
    print("Baseline model: {}".format(baseline_net))

    optimizer= optim.Adam(policy.parameters(), lr=args.lr)
    #optimizer= optim.RMSprop(policy.parameters(), lr=args.lr)

    ''' RUN EXPERIMENT '''
    print("Running experiment...")
    print("There are {} CPUs on this machine".format(multiprocessing.cpu_count()))
    experiment = Experiment(policy, optimizer, envs, n_train_steps=1000, eval_freq=10, save_freq=50, args=args)
    experiment._run()