Python PPO2.predict Exemples

Langage de programmation: Python

Espace de nommage/Pack: stable_baselines

Class/Type: PPO2

Méthode/Fonction: predict

Exemples au hotexamples.com: 2

Python PPO2.predict - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de stable_baselines.PPO2.predict extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

PPO2(30)

load(27)

learn(3)

predict(2)

save(1)

set_env(1)

Méthodes fréquemment utilisées

PPO2 (30)

load (27)

learn (3)

predict (2)

save (1)

set_env (1)

Exemple #1

0

Afficher le fichier

Fichier : seir_environment_joint_run_ppo_policy.py Projet : plibin-vub/epi-rl

def evaluate(env, model: PPO2, districts_ids, num_steps): obs = env.reset() sus_before = districts_susceptibles(env, districts_ids) for _ in range(num_steps): action, _states = model.predict(obs) obs, _, _, _ = env.step(action) sus_after = districts_susceptibles(env, districts_ids) attack_rate = 1.0 - (sus_after / sus_before) assert total_school_closures(env) <= len(districts_ids)*args.budget_in_weeks return attack_rate

Exemple #2

0

Afficher le fichier

""" global n_steps # Print stats every 1000 calls if (n_steps + 1) % 5 == 0: # Set Masks piece_mask = [1] * 16 position_mask = [1] * 64 updated_masks = {'action_mask' : [piece_mask, position_mask]} env.infos.update(updated_masks) n_steps += 1 return True model = PPO(MlpPolicy, env, verbose=1, tensorboard_log="run/") model.learn(250000) # model.save("expert_model") # Enjoy trained agent for _ in range(25): obs, done, action_masks = env.reset(), [False], [] for i in range(1000): action, _states = model.predict(obs, action_mask=action_masks) obs, _, done, infos = env.step(action) action_masks.clear() for info in infos: env_action_mask = info.get('action_mask') action_masks.append(env_action_mask) env.render()