Python stats Exemples

Langage de programmation: Python

Espace de nommage/Pack: ray.rllib.agents.sac.sac_torch_policy

Méthode/Fonction: stats

Exemples au hotexamples.com: 2

Python stats - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de ray.rllib.agents.sac.sac_torch_policy.stats extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Exemple #1

0

Afficher le fichier

def cql_stats(policy: Policy, train_batch: SampleBatch) -> Dict[str, TensorType]: sac_dict = stats(policy, train_batch) sac_dict["cql_loss"] = torch.mean(torch.stack(policy.cql_loss)) if policy.config["lagrangian"]: sac_dict["log_alpha_prime_value"] = policy.log_alpha_prime_value sac_dict["alpha_prime_value"] = policy.alpha_prime_value sac_dict["alpha_prime_loss"] = policy.alpha_prime_loss return sac_dict

Exemple #2

0

Afficher le fichier

Fichier : cql_torch_policy.py Projet : miqdigital/ray

def cql_stats(policy: Policy, train_batch: SampleBatch) -> Dict[str, TensorType]: # Get SAC loss stats. stats_dict = stats(policy, train_batch) # Add CQL loss stats to the dict. stats_dict["cql_loss"] = torch.mean( torch.stack(*policy.get_tower_stats("cql_loss"))) if policy.config["lagrangian"]: stats_dict["log_alpha_prime_value"] = torch.mean( torch.stack(policy.get_tower_stats("log_alpha_prime_value"))) stats_dict["alpha_prime_value"] = torch.mean( torch.stack(policy.get_tower_stats("alpha_prime_value"))) stats_dict["alpha_prime_loss"] = torch.mean( torch.stack(policy.get_tower_stats("alpha_prime_loss"))) return stats_dict