Python ParamsManager.get_environment_params 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: utils.params_manager

클래스/타입: ParamsManager

메소드/함수: get_environment_params

hotexamples.com에서의 예제들: 2

Python ParamsManager.get_environment_params - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 utils.params_manager.ParamsManager.get_environment_params에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

get_agent_params(6)

get_env_params(4)

export_agent_params(3)

export_env_params(3)

ParamsManager(2)

get_environment_params(2)

export_environment_params(1)

getInstance(1)

get_emulator_params(1)

get_goal_params(1)

get_hidden_params(1)

예제 #1

파일 보기

    def load(self, env_name):
        file_name = self.params['load_dir'] + "DQL_" + env_name + ".ptm"
        agent_state = torch.load(file_name,
                                 map_location=lambda storage, loc: storage)
        self.Q.load_state_dict(agent_state["Q"])
        self.Q.to(device)
        self.best_mean_reward = agent_state["best_mean_reward"]
        self.best_reward = agent_state["best_reward"]
        print("Cargado del modelo Q desde", file_name,
              "que hasta el momento tiene una mejor recompensa media de: ",
              self.best_mean_reward, " y una recompensa máxima de: ",
              self.best_reward)


if __name__ == "__main__":
    env_conf = manager.get_environment_params()
    env_conf["env_name"] = args.env

    if args.test:
        env_conf["episodic_life"] = False
    reward_type = "LIFE" if env_conf["episodic_life"] else "GAME"

    custom_region_available = False
    for key, value in env_conf["useful_region"].items():
        if key in args.env:
            env_conf["useful_region"] = value
            custom_region_available = True
            break
    if custom_region_available is not True:
        env_conf["useful_region"] = env_conf["useful_region"]["Default"]
    print("Configuración a utilizar:", env_conf)

예제 #2

파일 보기

                writer.add_scalar(self.actor_name + "/reward", reward,
                                  self.global_step_num)
                writer.add_scalar(self.actor_name + "/ep_reward", ep_reward,
                                  self.global_step_num)
                writer.add_scalar(self.actor_name + "/mean_ep_reward",
                                  np.mean(episode_rewards),
                                  self.global_step_num)
                writer.add_scalar(self.actor_name + "/max_ep_reward",
                                  self.best_reward, self.global_step_num)


if __name__ == "__main__":

    agent_params = manager.get_agent_params()
    agent_params["model_dir"] = args.output_dir
    agent_params["test"] = args.test

    env_params = manager.get_environment_params()
    env_params["env_name"] = args.env

    mp.set_start_method("spawn")

    agent_procs = [
        DeepActorCriticAgent(id, args.env, agent_params, env_params)
        for id in range(agent_params["num_agents"])
    ]

    [p.start() for p in agent_procs]
    [p.join() for p in agent_procs]