Esempi in Python per Transformer.get_trainable_parameters

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: model

Classe/tipologia: Transformer

Metodo/funzione: get_trainable_parameters

Esempi su hotexamples.com: 2

Transformer.get_trainable_parameters in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per model.Transformer.get_trainable_parameters, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

parameters(30)

Transformer(30)

load_state_dict(30)

eval(30)

cuda(13)

encode(5)

encoder(4)

decoder(4)

decode(4)

out(3)

load_dict(3)

load(2)

add_loss_op(2)

new(2)

generate_square_subsequent_mask(2)

beam_search(2)

get_trainable_parameters(2)

infer(2)

Transformer_decoder(1)

gen_js(1)

get_masks(1)

greedy_search(1)

inference(1)

load_from_checkpoint(1)

init(1)

eval_smaple(1)

load_model(1)

Embeddings(1)

load_weights(1)

make_src_mask(1)

make_trg_mask(1)

multi_gpu_train(1)

fit(1)

eval_gen(1)

eval_ppl(1)

compile(1)

add_optimizer(1)

apply(1)

apply_collective_grads(1)

batch_split_train(1)

build_graph(1)

build_test_model(1)

build_train_model(1)

calculate_loss(1)

clear_gradients(1)

compute_loss(1)

Transformer_encoder(1)

cpu(1)

create_model(1)

PositionwiseFeedForward(1)

Esempio n. 1

Mostra file

File: train.py Progetto: Kaixin-Wu/myTransformer

def init_training(args):
    """ Initialize training process """

    # load vocabulary
    vocab = torch.load(args.vocab)

    # build model
    transformer = Transformer(args, vocab)

    # if finetune
    if args.finetune:
        print("[Finetune] %s" % args.finetune_model_path)
        transformer.load_state_dict(torch.load(args.finetune_model_path))

    # vocab_mask for masking padding
    vocab_mask = torch.ones(len(vocab.tgt))
    vocab_mask[vocab.tgt[constants.PAD_WORD]] = 0

    # loss object
    cross_entropy_loss = nn.CrossEntropyLoss(weight=vocab_mask,
                                             size_average=False)

    if args.cuda:
        transformer = transformer.cuda()
        cross_entropy_loss = cross_entropy_loss.cuda()

    if args.optimizer == "Warmup_Adam":
        optimizer = ScheduledOptim(
            torch.optim.Adam(transformer.get_trainable_parameters(),
                             betas=(0.9, 0.98),
                             eps=1e-09), args.d_model, args.n_warmup_steps)

    if args.optimizer == "Adam":
        optimizer = torch.optim.Adam(
            params=transformer.get_trainable_parameters(),
            lr=args.lr,
            betas=(0.9, 0.98),
            eps=1e-8)

    if args.optimizer == 'SGD':
        optimizer = torch.optim.SGD(
            params=transformer.get_trainable_parameters(), lr=args.lr)

    # multi gpus
    if torch.cuda.device_count() > 1:
        print("[Multi GPU] using", torch.cuda.device_count(), "GPUs\n")
        transformer = nn.DataParallel(transformer)

    return vocab, transformer, optimizer, cross_entropy_loss

Esempio n. 2

Mostra file

                           corpus["train"]["tgt_indexs"],
                           corpus["train"]["tgt_texts"],
                           batch_size=args.batch_size,
                           cuda=use_cuda)

validation_data = DataLoader(corpus["valid"]["src_texts"],
                             corpus["valid"]["src_turn"],
                             corpus["valid"]["tgt_indexs"],
                             corpus["valid"]["tgt_texts"],
                             batch_size=args.batch_size,
                             cuda=use_cuda)

model = Transformer(args)

criterion = CrossEntropy()
optimizer = torch.optim.Adam(model.get_trainable_parameters(),
                             lr=args.learning_rate)

if use_cuda:
    model = model.cuda()
    criterion = criterion.cuda()


def get_performance(crit, distributes, gold):
    loss = crit(distributes, gold)
    _, predict = distributes.max(dim=-1)
    n_correct = predict.eq(gold)
    n_correct = n_correct.data.masked_select(gold.ne(const.PAD)).sum()

    n_gold = gold.ne(const.PAD).sum()