Python Transformer.load Beispiele

Programmiersprache: Python

Namespace / Paketname: model

Klasse / Typ: Transformer

Methode / Funktion: load

Beispiele auf hotexamples.com: 2

Python Transformer.load - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die model.Transformer.load, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

parameters(30)

Transformer(30)

load_state_dict(30)

eval(30)

cuda(13)

encode(5)

encoder(4)

decoder(4)

decode(4)

out(3)

load_dict(3)

load(2)

add_loss_op(2)

new(2)

generate_square_subsequent_mask(2)

beam_search(2)

get_trainable_parameters(2)

infer(2)

Transformer_decoder(1)

gen_js(1)

get_masks(1)

greedy_search(1)

inference(1)

load_from_checkpoint(1)

init(1)

eval_smaple(1)

load_model(1)

Embeddings(1)

load_weights(1)

make_src_mask(1)

make_trg_mask(1)

multi_gpu_train(1)

fit(1)

eval_gen(1)

eval_ppl(1)

compile(1)

add_optimizer(1)

apply(1)

apply_collective_grads(1)

batch_split_train(1)

build_graph(1)

build_test_model(1)

build_train_model(1)

calculate_loss(1)

clear_gradients(1)

compute_loss(1)

Transformer_encoder(1)

cpu(1)

create_model(1)

PositionwiseFeedForward(1)

Beispiel #1

Datei anzeigen

Datei: main.py Projekt: vbkaisetsu/transformer_primitiv

def main(config):
    mode = config['mode']
    if mode == 'preproc':
        preproc(config)
        return

    print('initializing device ...', end='', file=sys.stderr, flush=True)
    dev = D.Naive() if config['gpu'] < 0 else D.CUDA(config['gpu'])
    Device.set_default(dev)
    print("done.", file=sys.stderr, flush=True)

    prefix = config['model_prefix']
    if mode == 'train':
        model = Transformer(config['n_heads'], config['n_stacks'],
                            config['dropout'], config['generation_limit'])
        model.init(config['vocabulary_size'], config['d_model'],
                   config['d_ff'])
        optimizer = O.Adam(alpha=1, beta2=0.98, eps=1e-9)
        optimizer.set_gradient_clipping(5)
        train(model, optimizer, config, 1e10)
    elif mode == 'resume':
        print('loading model/optimizer ... ',
              end='',
              file=sys.stderr,
              flush=True)
        model = Transformer(config['n_heads'], config['n_stacks'],
                            config['dropout'], config['generation_limit'])
        model.load(prefix + '.model')
        optimizer = O.Adam(alpha=1, beta2=0.98, eps=1e-9)
        optimizer.set_gradient_clipping(5)
        optimizer.load(prefix + '.optimizer')
        with Path(prefix).with_suffix('.valid').open() as f:
            valid_ppl = float(f.read().strip())
        print('done.', file=sys.stderr, flush=True)
        train(model, optimizer, config, valid_ppl)
    elif mode == 'test':
        model = Transformer(config['n_heads'], config['n_stacks'],
                            config['dropout'], config['generation_limit'])
        model.load(prefix + '.model')
        test(model, config)

Beispiel #2

Datei anzeigen

def run_validation(epoch, dataset_name: str):
    dataset = load_data(dataset_name)
    print("Number of %s instances: %d" % (dataset_name, len(dataset)))

    model = Transformer(
        i2w=i2w, use_knowledge=args.use_knowledge, args=args, test=True
    ).cuda()
    model.load("{0}model_{1}.bin".format(args.save_path, epoch))
    model.transformer.eval()
    # Iterate over batches
    num_batches = math.ceil(len(dataset) / args.batch_size)
    cum_loss = 0
    cum_words = 0
    predicted_sentences = []
    indices = list(range(len(dataset)))
    for batch in tqdm(range(num_batches)):
        # Prepare batch
        batch_indices = indices[batch * args.batch_size : (batch + 1) * args.batch_size]
        batch_rows = [dataset[i] for i in batch_indices]

        # Encode batch. If facts are being used, they'll be prepended to the input
        input_seq, input_lens, target_seq, target_lens = model.prep_batch(batch_rows)

        # Decode batch
        predicted_sentences += model.decode(input_seq, input_lens)

        # Evaluate batch
        cum_loss += model.eval_ppl(input_seq, input_lens, target_seq, target_lens)
        cum_words += (target_seq != w2i["_pad"]).sum().item()

        # Log epoch
    ppl = math.exp(cum_loss / cum_words)
    print("{} Epoch: {} PPL: {}".format(dataset_name, epoch, ppl))
    # Save predictions
    open(
        "{0}{1}_epoch_{2}.pred".format(args.save_path, dataset_name, str(epoch)), "w+"
    ).writelines([l + "\n" for l in predicted_sentences])