Python BertConfig.save_pretrained 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: transformers

클래스/타입: BertConfig

메소드/함수: save_pretrained

hotexamples.com에서의 예제들: 4

Python BertConfig.save_pretrained - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 transformers.BertConfig.save_pretrained에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

from_json_file(30)

from_pretrained(30)

BertConfig(28)

output_hidden_states(18)

vocab_size(13)

num_hidden_layers(9)

max_position_embeddings(7)

get_config_dict(6)

is_decoder(5)

hidden_size(5)

num_attention_heads(4)

save_pretrained(4)

add_cross_attention(4)

checkpoint_output_dir(4)

num_labels(3)

embedding_serialization_factor(3)

from_dict(3)

recompute_checkpoint_every_layer(3)

__init__(2)

layer_norm_eps(2)

output_attentions(2)

attention_probs_dropout_prob(2)

to_dict(2)

update(2)

hidden_dropout_prob(2)

pixel_random_sampling_size(1)

push_to_hub(1)

auto_map(1)

num_masked_blocks(1)

max_length(1)

intermediate_size(1)

CR(1)

from_pertrained(1)

embedding_serialization(1)

dropout_prob(1)

crf_labels(1)

identifier(1)

예제 #1

파일 보기

    def test_push_to_hub_in_organization(self):
        config = BertConfig(vocab_size=99,
                            hidden_size=32,
                            num_hidden_layers=5,
                            num_attention_heads=4,
                            intermediate_size=37)
        config.push_to_hub("valid_org/test-config-org",
                           use_auth_token=self._token)

        new_config = BertConfig.from_pretrained("valid_org/test-config-org")
        for k, v in config.to_dict().items():
            if k != "transformers_version":
                self.assertEqual(v, getattr(new_config, k))

        # Reset repo
        delete_repo(token=self._token, repo_id="valid_org/test-config-org")

        # Push to hub via save_pretrained
        with tempfile.TemporaryDirectory() as tmp_dir:
            config.save_pretrained(tmp_dir,
                                   repo_id="valid_org/test-config-org",
                                   push_to_hub=True,
                                   use_auth_token=self._token)

        new_config = BertConfig.from_pretrained("valid_org/test-config-org")
        for k, v in config.to_dict().items():
            if k != "transformers_version":
                self.assertEqual(v, getattr(new_config, k))

예제 #2

파일 보기

    def test_push_to_hub(self):
        config = BertConfig(
            vocab_size=99, hidden_size=32, num_hidden_layers=5, num_attention_heads=4, intermediate_size=37
        )
        with tempfile.TemporaryDirectory() as tmp_dir:
            config.save_pretrained(os.path.join(tmp_dir, "test-config"), push_to_hub=True, use_auth_token=self._token)

            new_config = BertConfig.from_pretrained(f"{USER}/test-config")
            for k, v in config.__dict__.items():
                if k != "transformers_version":
                    self.assertEqual(v, getattr(new_config, k))

예제 #3

파일 보기

def main():
    seed_everyone(20210318)

    raw_data_path = '../user_data/duality_pair_pretrain_no_nsp.tsv'
    output_dir = '../user_data/tmp_data/pretrain_output/whole_word_mask_bert_output'

    tokenizer = BertTokenizer.from_pretrained('../user_data/vocab_.txt')
    data = read_data(raw_data_path, tokenizer, debug=True)

    train_dataset = TcDataset(data)

    config = BertConfig(
        vocab_size=tokenizer.vocab_size,
        max_position_embeddings=100,
        type_vocab_size=2,
        pad_token_id=0,
    )
    model = BertForMaskedLM(config=config)
    wandb.init(project=f"bert_oppo_pretrain1", entity="zjw", dir=output_dir)
    data_collator = Data_Collator(max_seq_len=42,
                                  tokenizer=tokenizer,
                                  mlm_p=0.15)

    model_save_dir = os.path.join(output_dir, 'best_model_ckpt')
    tokenizer_and_config = os.path.join(output_dir, 'tokenizer_and_config')
    check_dir(model_save_dir)
    check_dir(tokenizer_and_config)

    training_args = TrainingArguments(output_dir=output_dir,
                                      overwrite_output_dir=True,
                                      num_train_epochs=100,
                                      fp16_backend='auto',
                                      per_device_train_batch_size=128,
                                      save_steps=500,
                                      logging_steps=500,
                                      save_total_limit=10,
                                      prediction_loss_only=True,
                                      run_name='0419',
                                      logging_first_step=True,
                                      dataloader_num_workers=4,
                                      disable_tqdm=False,
                                      seed=202104)

    trainer = Trainer(
        model=model,
        args=training_args,
        data_collator=data_collator,
        train_dataset=train_dataset,
    )

    trainer.train()
    trainer.save_model(model_save_dir)
    config.save_pretrained(tokenizer_and_config)
    tokenizer.save_pretrained(tokenizer_and_config)

예제 #4

파일 보기

파일: test_configuration_common.py 프로젝트: whaozl/transformers

    def test_push_to_hub_in_organization(self):
        config = BertConfig(
            vocab_size=99, hidden_size=32, num_hidden_layers=5, num_attention_heads=4, intermediate_size=37
        )

        with tempfile.TemporaryDirectory() as tmp_dir:
            config.save_pretrained(
                tmp_dir,
                push_to_hub=True,
                repo_name="test-model-org",
                use_auth_token=self._token,
                organization="valid_org",
            )

            new_config = BertConfig.from_pretrained("valid_org/test-model-org")
            for k, v in config.__dict__.items():
                if k != "transformers_version":
                    self.assertEqual(v, getattr(new_config, k))