Python _gen_mask Exemples

Langage de programmation: Python

Espace de nommage/Pack: reagent.models.synthetic_reward

Méthode/Fonction: _gen_mask

Exemples au hotexamples.com: 2

Python _gen_mask - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de reagent.models.synthetic_reward._gen_mask extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Exemple #1

0

Afficher le fichier

Fichier : test_synthetic_reward_net.py Projet : bobycv06fpm/ReAgent

def test_ngram_synthetic_reward(self): state_dim = 10 action_dim = 2 sizes = [256, 128] activations = ["sigmoid", "relu"] last_layer_activation = "leaky_relu" context_size = 3 reward_net = NGramSyntheticRewardNet( state_dim=state_dim, action_dim=action_dim, sizes=sizes, activations=activations, last_layer_activation=last_layer_activation, context_size=context_size, ) dnn = reward_net.fc.dnn assert dnn[0].in_features == (state_dim + action_dim) * context_size assert dnn[0].out_features == 256 assert dnn[1]._get_name() == "Sigmoid" assert dnn[2].in_features == 256 assert dnn[2].out_features == 128 assert dnn[3]._get_name() == "ReLU" assert dnn[4].in_features == 128 assert dnn[4].out_features == 1 assert dnn[5]._get_name() == "LeakyReLU" valid_step = torch.tensor([[1], [2], [3]]) batch_size = 3 seq_len = 4 mask = synthetic_reward._gen_mask(valid_step, batch_size, seq_len) assert torch.all( mask == torch.tensor([[0.0, 0.0, 0.0, 1.0], [0.0, 0.0, 1.0, 1.0], [0.0, 1.0, 1.0, 1.0]]))

Exemple #2

0

Afficher le fichier

Fichier : test_synthetic_reward_net.py Projet : bobycv06fpm/ReAgent

def test_single_step_synthetic_reward(self): state_dim = 10 action_dim = 2 sizes = [256, 128] activations = ["sigmoid", "relu"] last_layer_activation = "leaky_relu" reward_net = SingleStepSyntheticRewardNet( state_dim=state_dim, action_dim=action_dim, sizes=sizes, activations=activations, last_layer_activation=last_layer_activation, ) dnn = reward_net.export_mlp() # dnn[0] is a concat layer assert dnn[1].in_features == state_dim + action_dim assert dnn[1].out_features == 256 assert dnn[2]._get_name() == "Sigmoid" assert dnn[3].in_features == 256 assert dnn[3].out_features == 128 assert dnn[4]._get_name() == "ReLU" assert dnn[5].in_features == 128 assert dnn[5].out_features == 1 assert dnn[6]._get_name() == "LeakyReLU" valid_step = torch.tensor([[1], [2], [3]]) batch_size = 3 seq_len = 4 mask = synthetic_reward._gen_mask(valid_step, batch_size, seq_len) assert torch.all( mask == torch.tensor([[0.0, 0.0, 0.0, 1.0], [0.0, 0.0, 1.0, 1.0], [0.0, 1.0, 1.0, 1.0]]))