Python Dataset.get_batches Beispiele

Programmiersprache: Python

Namespace / Paketname: utils

Klasse / Typ: Dataset

Methode / Funktion: get_batches

Beispiele auf hotexamples.com: 2

Python Dataset.get_batches - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die utils.Dataset.get_batches, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Dataset(23)

load_part(9)

get_part_features(8)

next_batch(4)

load_batch(4)

get_fold_instances(2)

get_df(2)

get_corpus(2)

get_batches(2)

generator(2)

item2image_u2a(2)

load_save_images(1)

load_set(1)

item2image(1)

load_img_from_dir(1)

load_data(1)

load_transX(1)

load_u2a_LINE(1)

load_val_batch(1)

minibatchs(1)

nextBatch(1)

prepare(1)

iterate_once(1)

item_user2image_u2e(1)

reset_train_iter(1)

item4cke(1)

load_json(1)

get_test_data(1)

get_val_data(1)

clone_for_validation(1)

WavDataset(1)

__getitem__(1)

__len__(1)

add_position(1)

batch_gen(1)

build(1)

build_vocab(1)

classify_faces_age_gender(1)

collect_images(1)

get_train_data(1)

create_dataset(1)

current_index(1)

decode(1)

detect_faces(1)

get_exams(1)

get_idx(1)

get_mini_batch(1)

MelSpecDataset(1)

get_tf_data(1)

reset_valid_iter(1)

Beispiel #1

Datei anzeigen

Datei: bilstm.py Projekt: ParsonsZeng/DQI

def run():
    print('Loading data...')
    with open('data/data_emb', 'rb') as f:
        all_sets, embs, word2idx = pickle.load(f)
    emb_layer = nn.Embedding(embs.shape[0], embs.shape[1])
    emb_layer.weight = nn.Parameter(torch.from_numpy(embs))
    model = Model(emb_layer).cuda()
    optimizer = torch.optim.Adam(model.parameters(),
                                 lr=hparams['learning_rate'])
    train_set = Dataset(all_sets[0], shuffle=True, pad_keys=('q1', 'q2'))
    dev_set = Dataset(all_sets[1], shuffle=False, pad_keys=('q1', 'q2'))
    test_set = Dataset(all_sets[2], shuffle=False, pad_keys=('q1', 'q2'))
    step = 0
    sum_loss = 0
    dev_best = 0
    test_score = 0
    print("Starting training...")
    print(hparams)
    start_time = time.time()
    for epoch in range(hparams['max_epoch']):
        batches, batch_lengths = train_set.get_batches(hparams['batch_size'],
                                                       ('q1', 'q2', 'y'))
        for b_data, b_lengths in zip(batches, batch_lengths):
            sum_loss += run_batch(b_data, b_lengths, model, optimizer)
            step += 1
            if step % hparams['display_step'] == 0:
                avg_loss = sum_loss / hparams['display_step']
                sum_loss = 0
                dev_score = run_epoch_eval(dev_set, model)
                out_str = f'Epoc {epoch} iter {step} took {time.time() - start_time:.1f}s\n' \
                          f'loss:\t{avg_loss:.5f}\tdev score:\t{dev_score:.4f}'
                if dev_score > dev_best:
                    dev_best = dev_score
                    output_file = f'pred/{get_script_short_name(__file__)}.pred'
                    test_score = run_epoch_eval(test_set, model, output_file)
                    out_str += f'\t*** New best dev ***\ttest score:\t{test_score:.4f}'
                print(out_str)
                start_time = time.time()
    print('Best model on dev: dev:{:.4f}\ttest:{:.4f}'.format(
        dev_best, test_score))

Beispiel #2

Datei anzeigen

Datei: training.py Projekt: Parth-03/DuplicateQuestionIdentifier

train_data = Dataset(
    'C:\\Users\\sanujb\\PycharmProjects\\CS585_FinalProject\\MaLSTM\\data\\train.csv',
    model)
config = Config(len(train_data.vocab))
rnn = SiameseLSTM(config, train_data.model)

loss_function = nn.BCELoss()
optimizer = optim.Adadelta(rnn.encoder_params())
num_epochs = 100
train_size = 80000

for epoch in range(num_epochs):
    start_time = timeit.default_timer()
    epoch_loss = 0
    batch_num = 1
    for batch, targets in train_data.get_batches(config.batch_size,
                                                 train_size):
        preds = rnn(batch)
        batch_loss = loss_function(preds, targets)
        epoch_loss += batch_loss

        optimizer.zero_grad()  # reset the gradients from the last batch
        batch_loss.backward()  # does backprop!!!
        torch.nn.utils.clip_grad_norm_(rnn.encoder_params(), 0.25)
        optimizer.step()  # updates parameters using gradients

        if batch_num % 100 == 0:
            print('Batch number: {}, batch loss: {}, epoch loss {}'.format(
                batch_num, batch_loss, epoch_loss))
        batch_num += 1

    print(epoch, epoch_loss)