Python make_multitask_test_plots 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: mjrl.utils.make_train_plots

메소드/함수: make_multitask_test_plots

hotexamples.com에서의 예제들: 3

Python make_multitask_test_plots - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 mjrl.utils.make_train_plots.make_multitask_test_plots에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: walker_tune.py 프로젝트: Lifelong-ML/LPG-FTW

            f = open(job_name_ewc_seed_lambda+'/trained_ewc_baseline.pickle', 'wb')
            pickle.dump(baseline_ewc, f)
            f.close()
            f = open(job_name_ewc_seed_lambda+'/trained_ewc_alphas.pickle', 'wb')
            pickle.dump(agent_ewc.theta, f)
            f.close()
            f = open(job_name_ewc_seed_lambda+'/trained_ewc_grads.pickle', 'wb')
            pickle.dump(agent_ewc.grad, f)
            f.close()
            f = open(job_name_ewc_seed_lambda+'/trained_ewc_hess.pickle', 'wb')
            pickle.dump(agent_ewc.hess, f)
            f.close()
            f = open(job_name_ewc_seed_lambda+'/env_factors.pickle', 'wb')
            pickle.dump(size_factors_list, f)
            f.close()

            make_multitask_train_plots(loggers=agent_ewc.logger, keys=['stoc_pol_mean'], save_loc=job_name_ewc_seed_lambda+'/logs/')

            mean_test_perf = agent_ewc.test_tasks(test_rollouts=10,
                                num_cpu=num_cpu)
            result = np.mean(list(mean_test_perf.values()))
            print(result)
            make_multitask_test_plots(mean_test_perf, save_loc=job_name_ewc_seed_lambda+'/')

            result_file = open(job_name_ewc_seed_lambda + '/results.txt', 'w')
            result_file.write(str(mean_test_perf))
            result_file.close()

      SEED += 10

예제 #2

파일 보기

파일: half_cheetah_pgftw.py 프로젝트: Lifelong-ML/LPG-FTW

    f = open(job_name_lpgftw_seed + '/trained_mtl_baseline.pickle', 'wb')
    pickle.dump(baseline_mtl, f)
    f.close()
    f = open(job_name_lpgftw_seed + '/trained_mtl_alphas.pickle', 'wb')
    pickle.dump(agent_mtl.theta, f)
    f.close()
    f = open(job_name_lpgftw_seed + '/trained_mtl_grads.pickle', 'wb')
    pickle.dump(agent_mtl.grad, f)
    f.close()
    f = open(job_name_lpgftw_seed + '/trained_mtl_hess.pickle', 'wb')
    pickle.dump(agent_mtl.hess, f)
    f.close()
    f = open(job_name_lpgftw_seed + '/task_order.pickle', 'wb')
    pickle.dump(task_order, f)
    f.close()

    make_multitask_train_plots(loggers=agent_mtl.logger,
                               keys=['stoc_pol_mean'],
                               save_loc=job_name_lpgftw_seed + '/logs/')

    mean_test_perf = agent_mtl.test_tasks(test_rollouts=10, num_cpu=num_cpu)
    result = np.mean(list(mean_test_perf.values()))
    print(result)
    make_multitask_test_plots(mean_test_perf,
                              save_loc=job_name_lpgftw_seed + '/')
    result_file = open(job_name_lpgftw_seed + '/results.txt', 'w')
    result_file.write(str(mean_test_perf))
    result_file.close()

    SEED += 10

예제 #3

파일 보기

                evaluation_rollouts=5,
                task_id=task_id)
    agent_mtl.add_approximate_cost(N=10, task_id=task_id, num_cpu=1)

    train_agent(job_name=job_name_stl,
                agent=agent_stl[task_id],
                seed=SEED,
                niter=50,
                gamma=0.995,
                gae_lambda=0.97,
                num_cpu=num_cpu,
                sample_mode='trajectories',
                num_traj=10,
                save_freq=5,
                evaluation_rollouts=5,
                task_id=task_id)
    loggers_stl[task_id] = agent_stl[task_id].logger
    print("time taken for linear policy training = %f" % (timer.time() - ts))

make_multitask_train_plots(loggers=agent_mtl.logger,
                           keys=['stoc_pol_mean'],
                           save_loc=job_name_mtl + '/logs/')
make_multitask_train_plots(loggers=loggers_stl,
                           keys=['stoc_pol_mean'],
                           save_loc=job_name_stl + '/logs/')

mean_test_perf = agent_mtl.test_tasks(test_rollouts=10, num_cpu=num_cpu)
result = np.mean(list(mean_test_perf.values()))
print(result)
make_multitask_test_plots(mean_test_perf, save_loc=job_name_mtl + '/')