Python TFPolicy.get_weights Exemples

Langage de programmation: Python

Espace de nommage/Pack: mlagents.trainers.policy.tf_policy

Class/Type: TFPolicy

Méthode/Fonction: get_weights

Exemples au hotexamples.com: 4

Python TFPolicy.get_weights - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de mlagents.trainers.policy.tf_policy.TFPolicy.get_weights extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

TFPolicy(13)

get_current_step(7)

create_tf_graph(6)

get_weights(4)

initialize(4)

init_load_weights(3)

update_normalization(3)

_convert_version_string(2)

set_step(2)

broadcast_global_variables(1)

create_input_placeholders(1)

evaluate(1)

first_normalization_update(1)

increment_step(1)

initialize_or_load(1)

Méthodes fréquemment utilisées

TFPolicy (13)

get_current_step (7)

create_tf_graph (6)

get_weights (4)

initialize (4)

init_load_weights (3)

update_normalization (3)

_convert_version_string (2)

set_step (2)

broadcast_global_variables (1)

Méthodes fréquemment utilisées

create_input_placeholders (1)

evaluate (1)

first_normalization_update (1)

increment_step (1)

initialize_or_load (1)

Exemple #1

0

Afficher le fichier

def add_policy(self, parsed_behavior_id: BehaviorIdentifiers, policy: TFPolicy) -> None: """ Adds policy to trainer. The first policy encountered sets the wrapped trainer team. This is to ensure that all agents from the same multi-agent team are grouped. All policies associated with this team are added to the wrapped trainer to be trained. :param name_behavior_id: Behavior ID that the policy should belong to. :param policy: Policy to associate with name_behavior_id. """ name_behavior_id = parsed_behavior_id.behavior_id team_id = parsed_behavior_id.team_id self.controller.subscribe_team_id(team_id, self) self.policies[name_behavior_id] = policy policy.create_tf_graph() self._name_to_parsed_behavior_id[name_behavior_id] = parsed_behavior_id # for saving/swapping snapshots policy.init_load_weights() # First policy or a new agent on the same team encountered if self.wrapped_trainer_team is None or team_id == self.wrapped_trainer_team: self.current_policy_snapshot[ parsed_behavior_id.brain_name] = policy.get_weights() self._save_snapshot( ) # Need to save after trainer initializes policy self.trainer.add_policy(parsed_behavior_id, policy) self._learning_team = self.controller.get_learning_team self.wrapped_trainer_team = team_id

Exemple #2

0

Afficher le fichier

Fichier : trainer.py Projet : zer05um2017/ml-agents

def add_policy(self, name_behavior_id: str, policy: TFPolicy) -> None: """ Adds policy to trainer. For the first policy added, add a trainer to the policy and set the learning behavior name to name_behavior_id. :param name_behavior_id: Behavior ID that the policy should belong to. :param policy: Policy to associate with name_behavior_id. """ self.policies[name_behavior_id] = policy policy.create_tf_graph() # First policy encountered if not self.learning_behavior_name: weights = policy.get_weights() self.current_policy_snapshot = weights self.trainer.add_policy(name_behavior_id, policy) self._save_snapshot( policy) # Need to save after trainer initializes policy self.learning_behavior_name = name_behavior_id behavior_id_parsed = BehaviorIdentifiers.from_name_behavior_id( self.learning_behavior_name) team_id = behavior_id_parsed.behavior_ids["team"] self._stats_reporter.add_property(StatsPropertyType.SELF_PLAY_TEAM, team_id) else: # for saving/swapping snapshots policy.init_load_weights()

Exemple #3

0

Afficher le fichier

Fichier : trainer.py Projet : zer05um2017/ml-agents

def _save_snapshot(self, policy: TFPolicy) -> None: weights = policy.get_weights() try: self.policy_snapshots[self.snapshot_counter] = weights except IndexError: self.policy_snapshots.append(weights) self.policy_elos[self.snapshot_counter] = self.current_elo self.snapshot_counter = (self.snapshot_counter + 1) % self.window

Exemple #4

0

Afficher le fichier

def add_policy(self, name_behavior_id: str, policy: TFPolicy) -> None: """ Adds policy to trainer. For the first policy added, add a trainer to the policy and set the learning behavior name to name_behavior_id. :param name_behavior_id: Behavior ID that the policy should belong to. :param policy: Policy to associate with name_behavior_id. """ self.policies[name_behavior_id] = policy policy.create_tf_graph() # First policy encountered if not self.learning_behavior_name: weights = policy.get_weights() self.current_policy_snapshot = weights self.trainer.add_policy(name_behavior_id, policy) self._save_snapshot(policy) # Need to save after trainer initializes policy self.learning_behavior_name = name_behavior_id else: # for saving/swapping snapshots policy.init_load_weights()