Python BertConfig.checkpoint_output_dir Exemples

Langage de programmation: Python

Espace de nommage/Pack: transformers

Class/Type: BertConfig

Méthode/Fonction: checkpoint_output_dir

Exemples au hotexamples.com: 4

Python BertConfig.checkpoint_output_dir - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de transformers.BertConfig.checkpoint_output_dir extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

from_json_file(30)

from_pretrained(30)

BertConfig(28)

output_hidden_states(18)

vocab_size(13)

num_hidden_layers(9)

max_position_embeddings(7)

get_config_dict(6)

is_decoder(5)

hidden_size(5)

num_attention_heads(4)

save_pretrained(4)

add_cross_attention(4)

checkpoint_output_dir(4)

num_labels(3)

embedding_serialization_factor(3)

from_dict(3)

recompute_checkpoint_every_layer(3)

__init__(2)

layer_norm_eps(2)

output_attentions(2)

attention_probs_dropout_prob(2)

to_dict(2)

update(2)

hidden_dropout_prob(2)

pixel_random_sampling_size(1)

push_to_hub(1)

auto_map(1)

num_masked_blocks(1)

max_length(1)

intermediate_size(1)

CR(1)

from_pertrained(1)

embedding_serialization(1)

dropout_prob(1)

crf_labels(1)

identifier(1)

Méthodes fréquemment utilisées

from_json_file (30)

from_pretrained (30)

BertConfig (28)

output_hidden_states (18)

vocab_size (13)

num_hidden_layers (9)

max_position_embeddings (7)

get_config_dict (6)

is_decoder (5)

hidden_size (5)

Méthodes fréquemment utilisées

num_attention_heads (4)

save_pretrained (4)

add_cross_attention (4)

checkpoint_output_dir (4)

num_labels (3)

embedding_serialization_factor (3)

from_dict (3)

recompute_checkpoint_every_layer (3)

__init__ (2)

layer_norm_eps (2)

output_attentions (2)

attention_probs_dropout_prob (2)

to_dict (2)

update (2)

hidden_dropout_prob (2)

pixel_random_sampling_size (1)

push_to_hub (1)

auto_map (1)

num_masked_blocks (1)

max_length (1)

Méthodes fréquemment utilisées

output_attentions (2)

attention_probs_dropout_prob (2)

to_dict (2)

update (2)

hidden_dropout_prob (2)

pixel_random_sampling_size (1)

push_to_hub (1)

auto_map (1)

num_masked_blocks (1)

max_length (1)

intermediate_size (1)

CR (1)

from_pertrained (1)

embedding_serialization (1)

dropout_prob (1)

crf_labels (1)

identifier (1)

Méthodes fréquemment utilisées

intermediate_size (1)

CR (1)

from_pertrained (1)

embedding_serialization (1)

dropout_prob (1)

crf_labels (1)

identifier (1)

Exemple #1

0

Afficher le fichier

Fichier : checkpoint_test.py Projet : graphcore/examples

def test_checkpoint_embedding_serialization(embedding_serialization_factor): """ If a checkpoint is saved with embedding_serialization_factor then we should be able to restore the checkpoint in a new run where embedding_serialization_factor isn't used. The reverse should also hold. """ args = """ --config unit_test """.split() config1 = BertConfig(**(vars(parse_bert_args(args)))) config1.embedding_serialization_factor = embedding_serialization_factor model1 = PipelinedBertForPretraining(config1).parallelize() with tempfile.TemporaryDirectory() as dir: # Save checkpoint config1.checkpoint_output_dir = dir save_checkpoint(config1, model1, 0) # New model with opposite embedding_serialization to model1 config2 = BertConfig(**(vars(parse_bert_args(args)))) config2.embedding_serialization_factor = 5 if embedding_serialization_factor == 1 else 1 model2 = PipelinedBertForPretraining.from_pretrained(os.path.join(dir, "step_0"), config=config2).parallelize() assert model2.config.embedding_serialization_factor == config2.embedding_serialization_factor # Models should now have the same weights for name, tensor1 in model1.state_dict().items(): tensor2 = model2.state_dict()[name] assert torch.allclose(tensor1, tensor2)

Exemple #2

0

Afficher le fichier

Fichier : checkpoint_test.py Projet : graphcore/examples

def test_checkpoint_recompute_checkpoint(recompute_checkpoint): """ If a checkpoint is saved with `recompute_checkpoint_every_layer` then we should be able to restore the checkpoint in a new run that doesn't use `recompute_checkpoint_every_layer` and vice-verse. """ args = """ --config unit_test """.split() config1 = BertConfig(**(vars(parse_bert_args(args)))) config1.recompute_checkpoint_every_layer = recompute_checkpoint model1 = PipelinedBertForPretraining(config1).parallelize() with tempfile.TemporaryDirectory() as dir: # Save checkpoint config1.checkpoint_output_dir = dir save_checkpoint(config1, model1, 0) # New model with opposite `recompute_checkpoint` to model1 config2 = BertConfig(**(vars(parse_bert_args(args)))) config2.recompute_checkpoint_every_layer = not recompute_checkpoint model2 = PipelinedBertForPretraining.from_pretrained(os.path.join(dir, "step_0"), config=config2).parallelize() # Models should now have the same weights for name, tensor1 in model1.state_dict().items(): tensor2 = model2.state_dict()[name] assert torch.allclose(tensor1, tensor2)

Exemple #3

0

Afficher le fichier

Fichier : checkpoint_test.py Projet : graphcore/examples

def test_checkpoint_embedding_serialization_qa(embedding_serialization_factor): """ If a checkpoint is saved with embedding_serialization_factor then we should be able to restore the checkpoint in a new run where embedding_serialization_factor isn't used. The reverse should also hold. For PipelinedBertForQuestionAnswering we will need to call `deparallelize` before checkpointing. """ args = """ --config unit_test """.split() config = BertConfig(**(vars(parse_bert_args(args)))) config.embedding_serialization_factor = embedding_serialization_factor model1 = PipelinedBertForQuestionAnswering(config).parallelize() with tempfile.TemporaryDirectory() as dir: # Save checkpoint config.checkpoint_output_dir = dir model1.deparallelize() save_checkpoint(config, model1, 0) # Load the checkpoint, but don't call parallelize model2 = PipelinedBertForQuestionAnswering.from_pretrained(os.path.join(dir, "step_0")) # Models should have the same weights for name, tensor1 in model1.state_dict().items(): tensor2 = model2.state_dict()[name] assert torch.allclose(tensor1, tensor2)

Exemple #4

0

Afficher le fichier

Fichier : checkpoint_test.py Projet : graphcore/examples

def test_checkpoint_save_restore(recompute_checkpoint, embedding_serialization_factor): """ Test that saving and restoring checkpoints works. Also test checkpointing with recomputation checkpoints and embedding serialization. """ args = """ --config unit_test """.split() config = BertConfig(**(vars(parse_bert_args(args)))) config.recompute_checkpoint_every_layer = recompute_checkpoint config.embedding_serialization_factor = embedding_serialization_factor model1 = PipelinedBertForPretraining(config).parallelize() model2 = PipelinedBertForPretraining(config).parallelize() # The two models should have different initial weights for name, tensor1 in model1.state_dict().items(): tensor2 = model2.state_dict()[name] if (tensor1.dtype is not torch.int64) and ("LayerNorm" not in name) and ("bias" not in name): assert not torch.allclose(tensor1, tensor2) # Save and restore checkpoint with tempfile.TemporaryDirectory() as dir: config.checkpoint_output_dir = dir # No checkpoints should exist yet assert not checkpoints_exist(config.checkpoint_output_dir) save_checkpoint(config, model1, 0) # Checkpoint should now exist assert checkpoints_exist(config.checkpoint_output_dir) # Restore from checkpoint model2 = PipelinedBertForPretraining.from_pretrained(os.path.join(dir, "step_0"), config=config) # Models should now have the same weights for name, tensor1 in model1.state_dict().items(): tensor2 = model2.state_dict()[name] assert torch.allclose(tensor1, tensor2)