Python Policy.get_tower_stats Exemples

Langage de programmation: Python

Espace de nommage/Pack: ray.rllib.policy

Class/Type: Policy

Méthode/Fonction: get_tower_stats

Exemples au hotexamples.com: 2

Python Policy.get_tower_stats - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de ray.rllib.policy.Policy.get_tower_stats extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

__init__(11)

set_weights(5)

q_func_vars(4)

target_q_func_vars(3)

policy_spec(3)

td_error(2)

target_q_model(2)

entropy(2)

get_tower_stats(2)

spl_loss(2)

q_model(2)

_get_is_training_placeholder(2)

target_model(1)

q_values(1)

policy_loss(1)

pi_err(1)

p2sro_policy_spec(1)

model(1)

loss(1)

get_weights(1)

dist_class(1)

compute_single_action(1)

_lazy_tensor_dict(1)

to_log(1)

Méthodes fréquemment utilisées

__init__ (11)

set_weights (5)

q_func_vars (4)

target_q_func_vars (3)

policy_spec (3)

td_error (2)

target_q_model (2)

entropy (2)

get_tower_stats (2)

spl_loss (2)

Méthodes fréquemment utilisées

q_model (2)

_get_is_training_placeholder (2)

target_model (1)

q_values (1)

policy_loss (1)

pi_err (1)

p2sro_policy_spec (1)

model (1)

loss (1)

get_weights (1)

dist_class (1)

compute_single_action (1)

_lazy_tensor_dict (1)

to_log (1)

Méthodes fréquemment utilisées

dist_class (1)

compute_single_action (1)

_lazy_tensor_dict (1)

to_log (1)

Exemple #1

0

Afficher le fichier

Fichier : pg_torch_policy.py Projet : stjordanis/ray

def pg_loss_stats(policy: Policy, train_batch: SampleBatch) -> Dict[str, TensorType]: """Returns the calculated loss in a stats dict. Args: policy (Policy): The Policy object. train_batch (SampleBatch): The data used for training. Returns: Dict[str, TensorType]: The stats dict. """ return { "policy_loss": torch.mean(torch.stack(policy.get_tower_stats("policy_loss"))), }

Exemple #2

0

Afficher le fichier

def stats_fn(policy: Policy, batch: SampleBatch) -> Dict[str, TensorType]: return {"loss": torch.mean(torch.stack(policy.get_tower_stats("loss")))}