Python GPT2LMHeadModel.train Examples

Programming Language: Python

Namespace/Package Name: transformers

Class/Type: GPT2LMHeadModel

Method/Function: train

Examples at hotexamples.com: 2

Python GPT2LMHeadModel.train - 2 examples found. These are the top rated real world Python examples of transformers.GPT2LMHeadModel.train extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

GPT2LMHeadModel(30)

from_pretrained(30)

generate(5)

eval(3)

get_input_embeddings(2)

train(2)

zero_grad(2)

__init__(1)

forward(1)

from_pretrianed(1)

parameters(1)

save_pretrained(1)

to(1)

Example #1

Show file

File: trainer.py Project: razinkovnik/rugpt2

def eval(tokenizer: Tokenizer, model: GPT2LMHeadModel, dataset: MyDataset,
         args: TrainingArguments):
    model.eval()
    loss = 0
    iterator = build_data_iterator(tokenizer, dataset, args.eval_batch_size,
                                   args.block_size)
    for ids, attention_mask in tqdm(iterator, desc='eval'):
        ids = ids.to(args.device)
        with torch.no_grad():
            loss += model(ids,
                          attention_mask=attention_mask.to(args.device),
                          labels=ids)[0].item()
    model.train()
    return loss / len(iterator)

Example #2

Show file

File: run_fine_tune.py Project: zeta1999/KorQuAD-Question-Generation

def _validate(
    model: GPT2LMHeadModel,
    dev_dataloader: DataLoader,
    device: torch.device,
    logger: logging.Logger,
    global_step: int,
):
    model.eval()
    loss_list = []
    for batch_data in tqdm(dev_dataloader, desc="[EVAL]"):
        with torch.no_grad():
            input_ids, attention_mask, labels = tuple(value.to(device) for value in batch_data)
            model_outputs = model.forward(input_ids, attention_mask=attention_mask, labels=labels, return_dict=True)
            loss_list.append(model_outputs.loss.item())

    mean_loss = np.mean(loss_list)
    logger.info(f"[EVAL] global_step:{global_step} loss:{mean_loss:.4f} perplexity:{math.exp(mean_loss):.4f}")
    model.train()