Python Dagger.learn 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: dagger

클래스/타입: Dagger

메소드/함수: learn

hotexamples.com에서의 예제들: 3

Python Dagger.learn - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 dagger.Dagger.learn에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Dagger(7)

learn(3)

num_probes(2)

test(2)

eval_policy(1)

explore_only(1)

get_recent_rollout_states(1)

get_reward(1)

get_states(1)

learn_all_samples(1)

retrain(1)

rollout(1)

예제 #1

파일 보기

def main(argv):
    args = get_args(argv)

    x = env_args(args)
    print(x)

    policy_mod = import_module(args.policy_source)
    policy_class = getattr(policy_mod, 'DaggerPolicy')
    policy = policy_class(**vars(args))

    env = make(**vars(x))

    dagger = Dagger(env, policy, **vars(args))

    dagger.learn()

    env.close()

예제 #2

파일 보기

def main(argv):
    parser = argparse.ArgumentParser(description='block_world')
    parser.add_argument('--greedy', dest='greedy', action='store_true')
    parser.add_argument('--no-greedy', dest='greedy', action='store_false')
    parser.add_argument('--dims', type=int, default=3)
    parser.add_argument('--span', type=int, default=10)
    parser.add_argument('--max-timesteps', type=int, default=2000000)
    parser.add_argument('--exploration_fraction', type=float, default=0.1)
    parser.add_argument('--exploration_final_eps', type=float, default=0.01)
    parser.add_argument('--l2-penalty', type=float, default=None)
    parser.add_argument('--continous-actions',
                        dest='continous_actions',
                        action='store_true')
    parser.add_argument('--no-continous-actions',
                        dest='continous_actions',
                        action='store_false')
    parser.add_argument('--reach-minimum', type=float, default=0.1)
    parser.set_defaults(greedy=False)
    parser.set_defaults(continous_actions=False)
    cmd_args = parser.parse_args(argv)

    print(cmd_args)

    env = make(span=cmd_args.span,
               dims=cmd_args.dims,
               greedy=cmd_args.greedy,
               l2_penalty=cmd_args.l2_penalty,
               continous_actions=cmd_args.continous_actions,
               reach_minimum=cmd_args.reach_minimum)

    dagger = Dagger(env,
                    DaggerPolicy,
                    num_rollouts=25,
                    train_batch_size=25,
                    train_epochs=20,
                    iterations=20,
                    dir_name='tmp_storage')

    dagger.learn(save_file_name="dagger_dist_world")
    env.close()

예제 #3

파일 보기

파일: simple.py 프로젝트: amnonh-uw/block-world

def learn(env, policy):
    dagger = Dagger(env)
    dagger.learn(policy)