Python train_network 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ml.rl.workflow.parametric_dqn_workflow

메소드/함수: train_network

hotexamples.com에서의 예제들: 2

Python train_network - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ml.rl.workflow.parametric_dqn_workflow.train_network에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def _test_parametric_dqn_workflow(self, use_gpu=False, use_all_avail_gpus=False):
     """Run Parametric DQN workflow to ensure no crashes, algorithm correctness
     not tested here."""
     with tempfile.TemporaryDirectory() as tmpdirname:
         params = {
             "training_data_path": os.path.join(
                 curr_dir, "test_data/parametric_action/cartpole_training.json.bz2"
             ),
             "eval_data_path": os.path.join(
                 curr_dir, "test_data/parametric_action/cartpole_eval.json.bz2"
             ),
             "state_norm_data_path": os.path.join(
                 curr_dir, "test_data/parametric_action/state_features_norm.json"
             ),
             "action_norm_data_path": os.path.join(
                 curr_dir, "test_data/parametric_action/action_norm.json"
             ),
             "model_output_path": tmpdirname,
             "use_gpu": use_gpu,
             "use_all_avail_gpus": use_all_avail_gpus,
             "epochs": 1,
             "rl": {},
             "rainbow": {},
             "training": {"minibatch_size": 128},
         }
         predictor = parametric_dqn_workflow.train_network(params)
         test_float_state_features = [{"0": 1.0, "1": 1.0, "2": 1.0, "3": 1.0}]
         test_int_state_features = [{}]
         test_action_features = [{"4": 0.0, "5": 1.0}]
         q_values = predictor.predict(
             test_float_state_features, test_int_state_features, test_action_features
         )
     assert len(q_values[0].keys()) == 1

예제 #2

파일 보기

 def test_parametric_dqn_workflow(self):
     """Run Parametric DQN workflow to ensure no crashes, algorithm correctness
     not tested here."""
     params = {
         "training_data_path":
         os.path.join(
             curr_dir,
             "test_data/parametric_action/cartpole_training_data.json"),
         "state_norm_data_path":
         os.path.join(
             curr_dir,
             "test_data/parametric_action/state_features_norm.json"),
         "action_norm_data_path":
         os.path.join(curr_dir,
                      "test_data/parametric_action/action_norm.json"),
         "model_output_path":
         None,
         "use_gpu":
         False,
         "epochs":
         1,
         "rl": {},
         "rainbow": {},
         "training": {
             "minibatch_size": 16
         },
         "in_training_cpe":
         None,
     }
     predictor = parametric_dqn_workflow.train_network(params)
     test_float_state_features = [{"0": 1.0, "1": 1.0, "2": 1.0, "3": 1.0}]
     test_int_state_features = [{}]
     test_action_features = [{"4": 0.0, "5": 1.0}]
     q_values = predictor.predict(test_float_state_features,
                                  test_int_state_features,
                                  test_action_features)
     assert len(q_values[0].keys()) == 1