Esempi in Python per ReformerForMaskedLM.to

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: transformers

Classe/tipologia: ReformerForMaskedLM

Metodo/funzione: to

Esempi su hotexamples.com: 5

ReformerForMaskedLM.to in Python: 5 esempi trovati. Questi sono i migliori esempi reali in Python per transformers.ReformerForMaskedLM.to, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

ReformerForMaskedLM(6)

eval(5)

to(5)

from_pretrained(2)

train(2)

zero_grad(1)

Esempio n. 1

Mostra file

File: test_modeling_reformer.py Progetto: lego0901/pytea

 def create_and_check_reformer_with_mlm(self, config, input_ids, input_mask, choice_labels):
     config.is_decoder = False
     model = ReformerForMaskedLM(config=config)
     model.to(torch_device)
     model.eval()
     result = model(input_ids, attention_mask=input_mask, labels=input_ids)
     self.parent.assertEqual(result.logits.shape, (self.batch_size, self.seq_length, self.vocab_size))

Esempio n. 2

Mostra file

 def create_and_check_reformer_model_with_lm_backward(self, config, input_ids, input_mask, choice_labels):
     config.is_decoder = False
     config.lsh_num_chunks_after = 1
     model = ReformerForMaskedLM(config=config)
     model.to(torch_device)
     model.eval()
     loss = model(input_ids, attention_mask=input_mask, labels=input_ids)[0]
     loss.backward()

Esempio n. 3

Mostra file

File: test_modeling_reformer.py Progetto: lego0901/pytea

 def create_and_check_reformer_no_chunking(self, config, input_ids, input_mask, choice_labels):
     # force chunk length to be bigger than input_ids
     config.lsh_attn_chunk_length = 2 * input_ids.shape[-1]
     config.local_attn_chunk_length = 2 * input_ids.shape[-1]
     config.lsh_num_chunks_after = 1
     config.is_decoder = False
     model = ReformerForMaskedLM(config=config)
     model.to(torch_device)
     model.eval()
     output_logits = model(input_ids, attention_mask=input_mask)["logits"]
     self.parent.assertTrue(output_logits.shape[1] == input_ids.shape[-1])

Esempio n. 4

Mostra file

 def create_and_check_reformer_with_mlm(self, config, input_ids, input_mask, choice_labels):
     config.is_decoder = False
     model = ReformerForMaskedLM(config=config)
     model.to(torch_device)
     model.eval()
     loss, prediction_scores = model(input_ids, attention_mask=input_mask, labels=input_ids)
     result = {
         "loss": loss,
         "prediction_scores": prediction_scores,
     }
     self.parent.assertListEqual(
         list(result["prediction_scores"].size()), [self.batch_size, self.seq_length, self.vocab_size],
     )
     self.check_loss_output(result)

Esempio n. 5

Mostra file

File: test_modeling_reformer.py Progetto: lego0901/pytea

    def create_and_check_reformer_feed_backward_chunking(self, config, input_ids, input_mask, choice_labels):
        if not self.is_training:
            return

        # disable dropout
        config.hidden_dropout_prob = 0
        config.local_attention_probs_dropout_prob = 0
        config.lsh_attention_probs_dropout_prob = 0
        config.lsh_num_chunks_after = 1
        config.is_decoder = False

        torch.manual_seed(0)
        model = ReformerForMaskedLM(config=config)
        model.to(torch_device)
        model.train()
        model.zero_grad()
        loss_no_chunk, output_no_chunk = model(input_ids, labels=input_ids, attention_mask=input_mask)[:2]
        loss_no_chunk.backward()
        grad_slice_word_no_chunk = model.reformer.embeddings.word_embeddings.weight.grad[0, :5]
        grad_slice_position_factor_1_no_chunk = model.reformer.embeddings.position_embeddings.weights[0][1, 0, -5:]
        grad_slice_position_factor_2_no_chunk = model.reformer.embeddings.position_embeddings.weights[1][0, 1, :5]

        config.chunk_size_lm_head = 1
        config.chunk_size_feed_forward = 1

        torch.manual_seed(0)
        model = ReformerForMaskedLM(config=config)
        model.to(torch_device)
        model.train()
        model.zero_grad()
        loss_chunk, output_chunk = model(input_ids, labels=input_ids, attention_mask=input_mask)[:2]
        loss_chunk.backward()
        grad_slice_word_chunk = model.reformer.embeddings.word_embeddings.weight.grad[0, :5]
        grad_slice_position_factor_1_chunk = model.reformer.embeddings.position_embeddings.weights[0][1, 0, -5:]
        grad_slice_position_factor_2_chunk = model.reformer.embeddings.position_embeddings.weights[1][0, 1, :5]
        self.parent.assertTrue(torch.allclose(loss_chunk, loss_no_chunk, atol=1e-3))
        self.parent.assertTrue(torch.allclose(grad_slice_word_no_chunk, grad_slice_word_chunk, atol=1e-3))
        self.parent.assertTrue(
            torch.allclose(grad_slice_position_factor_1_chunk, grad_slice_position_factor_1_no_chunk, atol=1e-3)
        )
        self.parent.assertTrue(
            torch.allclose(grad_slice_position_factor_2_chunk, grad_slice_position_factor_2_no_chunk, atol=1e-3)
        )