Python ModelUtils.create_value_heads Exemples

Langage de programmation: Python

Espace de nommage/Pack: mlagents.trainers.models

Class/Type: ModelUtils

Méthode/Fonction: create_value_heads

Exemples au hotexamples.com: 2

Python ModelUtils.create_value_heads - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de mlagents.trainers.models.ModelUtils.create_value_heads extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

create_recurrent_encoder(8)

scaled_init(5)

normalize_vector_obs(5)

create_input_placeholders(5)

create_observation_streams(5)

create_visual_observation_encoder(4)

create_vector_observation_encoder(4)

create_visual_input(3)

create_schedule(3)

create_discrete_action_masking_layer(3)

create_normalizer(3)

break_into_branches(2)

create_value_heads(2)

create_vector_input(2)

create_learning_rate(2)

create_visual_input_placeholders(2)

create_global_steps(2)

get_encoder_for_type(1)

_check_resolution_for_encoder(1)

Méthodes fréquemment utilisées

create_recurrent_encoder (8)

scaled_init (5)

normalize_vector_obs (5)

create_input_placeholders (5)

create_observation_streams (5)

create_visual_observation_encoder (4)

create_vector_observation_encoder (4)

create_visual_input (3)

create_schedule (3)

create_discrete_action_masking_layer (3)

Méthodes fréquemment utilisées

create_normalizer (3)

break_into_branches (2)

create_value_heads (2)

create_vector_input (2)

create_learning_rate (2)

create_visual_input_placeholders (2)

create_global_steps (2)

get_encoder_for_type (1)

_check_resolution_for_encoder (1)

Exemple #1

0

Afficher le fichier

Fichier : optimizer.py Projet : uyeonH/ml-agents

def _create_dc_critic(self, h_size: int, num_layers: int, vis_encode_type: EncoderType) -> None: """ Creates Discrete control critic (value) network. :param h_size: Size of hidden linear layers. :param num_layers: Number of hidden linear layers. :param vis_encode_type: The type of visual encoder to use. """ hidden_stream = ModelUtils.create_observation_streams( self.policy.visual_in, self.policy.processed_vector_in, 1, h_size, num_layers, vis_encode_type, )[0] if self.policy.use_recurrent: hidden_value, memory_value_out = ModelUtils.create_recurrent_encoder( hidden_stream, self.memory_in, self.policy.sequence_length_ph, name="lstm_value", ) self.memory_out = memory_value_out else: hidden_value = hidden_stream self.value_heads, self.value = ModelUtils.create_value_heads( self.stream_names, hidden_value) self.all_old_log_probs = tf.placeholder( shape=[None, sum(self.policy.act_size)], dtype=tf.float32, name="old_probabilities", ) _, _, old_normalized_logits = ModelUtils.create_discrete_action_masking_layer( self.all_old_log_probs, self.policy.action_masks, self.policy.act_size) action_idx = [0] + list(np.cumsum(self.policy.act_size)) self.old_log_probs = tf.reduce_sum( (tf.stack( [ -tf.nn.softmax_cross_entropy_with_logits_v2( labels=self.policy. selected_actions[:, action_idx[i]:action_idx[i + 1]], logits=old_normalized_logits[:, action_idx[i]: action_idx[i + 1]], ) for i in range(len(self.policy.act_size)) ], axis=1, )), axis=1, keepdims=True, )

Exemple #2

0

Afficher le fichier

def _create_cc_critic( self, h_size: int, num_layers: int, vis_encode_type: EncoderType ) -> None: """ Creates Continuous control critic (value) network. :param h_size: Size of hidden linear layers. :param num_layers: Number of hidden linear layers. :param vis_encode_type: The type of visual encoder to use. """ hidden_stream = ModelUtils.create_observation_streams( self.policy.visual_in, self.policy.processed_vector_in, 1, h_size, num_layers, vis_encode_type, )[0] if self.policy.use_recurrent: hidden_value, memory_value_out = ModelUtils.create_recurrent_encoder( hidden_stream, self.memory_in, self.policy.sequence_length_ph, name="lstm_value", ) self.memory_out = memory_value_out else: hidden_value = hidden_stream self.value_heads, self.value = ModelUtils.create_value_heads( self.stream_names, hidden_value ) self.all_old_log_probs = tf.placeholder( shape=[None, sum(self.policy.act_size)], dtype=tf.float32, name="old_probabilities", ) self.old_log_probs = tf.reduce_sum( (tf.identity(self.all_old_log_probs)), axis=1, keepdims=True )