Python ddpg Beispiele

Programmiersprache: Python

Namespace / Paketname: all.presets.continuous

Methode / Funktion: ddpg

Beispiele auf hotexamples.com: 4

Python ddpg - 4 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die all.presets.continuous.ddpg, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Beispiel #1

Datei anzeigen

 def train(cls, num_frames: int):
     rl_agent = cls()
     preset = ddpg(device=rl_agent.device,
                   lr_q=Settings.LEARNING_RATE,
                   lr_pi=Settings.LEARNING_RATE)
     experiment = SingleEnvExperiment(preset, rl_agent.env)
     experiment.train(num_frames)
     default_log_dir = experiment._writer.log_dir
     copy_tree(default_log_dir, Settings.FULL_LOG_DIR)
     rmtree(default_log_dir)
     rl_agent.env.close()

Beispiel #2

Datei anzeigen

    def resume_training(cls, path, num_frames: int):
        rl_agent = cls()
        lr = Settings.LEARNING_RATE
        agent = ddpg(device=rl_agent.device, lr_q=lr, lr_pi=lr)
        q_module = torch.load(os.path.join(path, "q.pt"),
                              map_location='cpu').to(rl_agent.device)
        policy_module = torch.load(os.path.join(path, "policy.pt"),
                                   map_location='cpu').to(rl_agent.device)

        experiment = SingleEnvExperiment(agent, rl_agent.env)
        agent = experiment._agent.agent
        old_q = agent.q
        old_q.model.load_state_dict(q_module.state_dict())
        old_policy = agent.policy
        old_policy.model.load_state_dict(policy_module.state_dict())
        experiment.train(frames=num_frames)
        default_log_dir = experiment._writer.log_dir
        copy_tree(default_log_dir, Settings.FULL_LOG_DIR)
        rmtree(default_log_dir)
        rl_agent.env.close()

Beispiel #3

Datei anzeigen

Datei: pybullet.py Projekt: vwxyzjn/autonomous-learning-library

def main():
    device = 'cuda'

    frames = int(1e7)

    agents = [
        ddpg(last_frame=frames),
        ppo(last_frame=frames),
        sac(last_frame=frames)
    ]

    envs = [
        GymEnvironment(env, device) for env in [
            'AntBulletEnv-v0', "HalfCheetahBulletEnv-v0",
            'HumanoidBulletEnv-v0', 'HopperBulletEnv-v0',
            'Walker2DBulletEnv-v0'
        ]
    ]

    SlurmExperiment(agents,
                    envs,
                    frames,
                    sbatch_args={'partition': '1080ti-long'})

Beispiel #4

Datei anzeigen

 def test_ddpg(self):
     self.validate(ddpg(replay_start_size=50, device='cpu'))