Esempi in Python per BigBirdTokenizer

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: paddlenlp.transformers

Classe/tipologia: BigBirdTokenizer

Esempi su hotexamples.com: 6

BigBirdTokenizer in Python: 6 esempi trovati. Questi sono i migliori esempi reali in Python per paddlenlp.transformers.BigBirdTokenizer, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

from_pretrained(5)

BigBirdTokenizer(1)

Metodi utilizzati di frequente

from_pretrained (5)

BigBirdTokenizer (1)

Esempio n. 1

Mostra file

def main():
    # Initialization for the parallel enviroment
    assert args.device in [
        "cpu", "gpu", "xpu"
    ], "Invalid device! Available device should be cpu, gpu, or xpu."

    paddle.set_device(args.device)
    set_seed(args)
    # Define the model and metric
    model = BigBirdForSequenceClassification.from_pretrained(
        args.model_name_or_path)
    criterion = nn.CrossEntropyLoss()
    metric = paddle.metric.Accuracy()

    # Define the tokenizer and dataloader
    tokenizer = BigBirdTokenizer.from_pretrained(args.model_name_or_path)
    global config
    config = getattr(model,
                     BigBirdForSequenceClassification.base_model_prefix).config
    train_data_loader, test_data_loader = \
            create_dataloader(args.batch_size, args.max_encoder_length, tokenizer)

    # Define the Adam optimizer
    optimizer = paddle.optimizer.Adam(parameters=model.parameters(),
                                      learning_rate=args.learning_rate,
                                      epsilon=1e-6)

    # Finetune the classification model
    do_train(model, criterion, metric, optimizer, train_data_loader, tokenizer)

    # Evaluate the finetune model
    do_evalute(model, criterion, metric, test_data_loader)

Esempio n. 2

Mostra file

def main():
    # Initialization for the parallel enviroment
    paddle.set_device(args.device)
    set_seed(args)
    # Define the model and metric
    # In finetune task, bigbird performs better when setting dropout to zero.
    model = BigBirdForSequenceClassification.from_pretrained(
        args.model_name_or_path,
        attn_dropout=args.attn_dropout,
        hidden_dropout_prob=args.hidden_dropout_prob)

    criterion = nn.CrossEntropyLoss()
    metric = paddle.metric.Accuracy()

    # Define the tokenizer and dataloader
    tokenizer = BigBirdTokenizer.from_pretrained(args.model_name_or_path)
    config = getattr(model,
                     BigBirdForSequenceClassification.base_model_prefix).config
    train_data_loader, test_data_loader = \
            create_dataloader(args.batch_size, args.max_encoder_length, tokenizer, config)

    # Define the Adam optimizer
    optimizer = paddle.optimizer.Adam(parameters=model.parameters(),
                                      learning_rate=args.learning_rate,
                                      epsilon=1e-6)

    # Finetune the classification model
    do_train(model, criterion, metric, optimizer, train_data_loader, tokenizer)

    # Evaluate the finetune model
    do_evalute(model, criterion, metric, test_data_loader)

Esempio n. 3

Mostra file

 def setUp(self):
     np.random.seed(102)
     self.tokenizer = BigBirdTokenizer.from_pretrained(
         'bigbird-base-uncased')
     self.set_text()
     self.set_input()
     self.set_output()

Esempio n. 4

Mostra file

File: run_classifier.py Progetto: dot23/PaddleNLP

def main():
    # Initialization for the parallel enviroment
    paddle.set_device(args.device)
    set_seed(args)
    # Define the model and metric
    model = BigBirdForSequenceClassification.from_pretrained(
        args.model_name_or_path)
    criterion = nn.CrossEntropyLoss()
    metric = paddle.metric.Accuracy()

    # Define the tokenizer and dataloader
    tokenizer = BigBirdTokenizer.from_pretrained(args.model_name_or_path)
    global config
    config = BigBirdModel.pretrained_init_configuration[
        args.model_name_or_path]
    train_data_loader, test_data_loader = \
            create_dataloader(args.batch_size, args.max_encoder_length, tokenizer)

    # Define the Adam optimizer
    optimizer = paddle.optimizer.Adam(parameters=model.parameters(),
                                      learning_rate=args.learning_rate,
                                      epsilon=1e-6)

    # Finetune the classification model
    do_train(model, criterion, metric, optimizer, train_data_loader,
             test_data_loader)

    # Evaluate the finetune model
    do_evalute(model, criterion, metric, test_data_loader)

Esempio n. 5

Mostra file

 def setUp(self):
     self.tokenizer = BigBirdTokenizer.from_pretrained(
         'bigbird-base-uncased')

Esempio n. 6

Mostra file

 def test_not_exist_file(self):
     self.tokenizer = BigBirdTokenizer(sentencepiece_model_file='')