Python LSTM.parameters示例，model.LSTM.LSTM.parameters Python示例

示例#1

0

显示文件

def Train(train_loader, val_loader, weight_pos):
    print("Start Training!")
    if sys.argv[1] == "LSTM":
        model = LSTM(NUM_TASKS, BATCH_SIZE, DIM_EMB).cuda()
    elif sys.argv[1] == "CNN":
        model = CNN(NUM_TASKS, BATCH_SIZE, DIM_EMB).cuda()
    optimizer = optim.Adam(model.parameters(), lr=LEARNING_RATE)
    loss_criterion = nn.BCEWithLogitsLoss(pos_weight=weight_pos.cuda())
    last_val_score = 0.0
    for epoch in range(N_EPOCH):
        print("epoch " + str(epoch) + ": ")
        total_loss = 0.0
        #i = 0
        for x, y in train_loader:
            x = x.cuda()
            y = y.cuda()
            model.zero_grad()
            probs = model.forward(x).cuda()
            #print(i)
            #print(probs)
            loss = loss_criterion(probs, y)
            total_loss += loss
            loss.backward()  #retain_graph=True)
            optimizer.step()
            #i += 1
        print(f"loss on epoch {epoch} = {total_loss}")
        val_score = Val(val_loader, model)
        print(f"val_score on epoch {epoch} = {val_score}")
        if val_score <= last_val_score: break
        last_val_score = val_score
    return model

示例#2

0

显示文件

文件： main.py 项目： kk19990709/pytorch-AAPR

        model = CNN().to(device)
    model.text_embedding_layer.weight.data.copy_(
        TITLE.vocab.vectors).to(device)
    for para in model.text_embedding_layer.parameters():
        para.requires_grad = False
    # FIXME speedup
    print('define model done')
Watcher = EarlyStopping(model, 5, max_steps=opt.num_epochs)
# endregion

# %%
# region Criterion & Optimizer
if not opt.notrain:
    criterion = CrossEntropyLoss()
    if opt.optimizer == 'Adam':
        optimizer = Adam(model.parameters())
    if opt.optimizer == 'AdamW':
        optimizer = AdamW(model.parameters())
    # 使用1Cycle实现加速 FIXME
    torch.optim.lr_scheduler.OneCycleLR(optimizer,
                                        0.15,
                                        epochs=opt.num_epochs,
                                        steps_per_epoch=len(train_iter))
    print('criterion & Optimizer done')
# endregion

# %%
# region Train the model

if not opt.notrain:
    total_step = len(train_iter)

示例#3

0

显示文件

LABEL.build_vocab(train)

BATCH_SIZE = 1

train_iterator, valid_iterator = data.BucketIterator.splits(
    (train, val),
    batch_size=BATCH_SIZE,
    sort_key=lambda x: len(x.text),
    repeat=False)

INPUT_DIM = len(TEXT.vocab)
EMBEDDING_DIM = 100
HIDDEN_DIM = 256
OUTPUT_DIM = 1
model = LSTM(INPUT_DIM, EMBEDDING_DIM, HIDDEN_DIM, OUTPUT_DIM, BATCH_SIZE)
optimizer = optim.SGD(model.parameters(), lr=1e-3)
criterion = nn.BCEWithLogitsLoss()
device = torch.device('cuda')

model = model.to(device)
criterion = criterion.to(device)


def binary_accuracy(preds, y):
    """
    Returns accuracy per batch, i.e. if you get 8/10 right, this returns 0.8, NOT 8
    """
    # round predictions to the closest integer
    rounded_preds = torch.round(torch.sigmoid(preds))
    correct = (rounded_preds == y).float()  # convert into float for division
    acc = correct.sum() / len(correct)

示例#4

0

显示文件

def main():
    global epoch
    # Get arguments, setup,  prepare data and print some info
    args = parse()

    log_path = os.path.join("logs", args.name)
    if not os.path.exists(log_path):
        os.makedirs(log_path)
    writer = SummaryWriter(log_path)

    if args.task == 'babi':
        train_dataset = bAbIDataset(args.dataset_path, args.babi_task)
        val_dataset = bAbIDataset(args.dataset_path,
                                  args.babi_task,
                                  train=False)
    else:
        raise NotImplementedError

    # Setting up the Model
    if args.model == 'lstm':
        model = LSTM(40,
                     train_dataset.num_vocab,
                     100,
                     args.device,
                     sentence_size=max(train_dataset.sentence_size,
                                       train_dataset.query_size))
        print("Using LSTM")
    else:
        # model = REN(args.num_blocks, train_dataset.num_vocab, 100, args.device, train_dataset.sentence_size,
        #             train_dataset.query_size).to(args.device)
        model = RecurrentEntityNetwork(train_dataset.num_vocab,
                                       device=args.device,
                                       sequence_length=max(
                                           train_dataset.sentence_size,
                                           train_dataset.query_size))
        print("Using EntNet")
    if args.multi:  # TODO: Whats this?
        model = torch.nn.DataParallel(model, device_ids=args.gpu_range)

    if args.optimizer == 'adam':
        optimizer = torch.optim.Adam(model.parameters(),
                                     lr=args.lr,
                                     weight_decay=args.weight_decay)
    elif args.optimizer == 'sgd':
        optimizer = torch.optim.SGD(model.parameters(),
                                    lr=args.lr,
                                    weight_decay=args.weight_decay)
    else:
        Exception("Invalid optimizer")
    if args.cyc_lr:
        cycle_momentum = True if args.optimizer == 'sgd' else False
        lr_scheduler = torch.optim.lr_scheduler.CyclicLR(
            optimizer,
            5e-5,
            args.lr,
            cycle_momentum=cycle_momentum,
            step_size_up=args.cyc_step_size_up)
    else:
        lr_scheduler = torch.optim.lr_scheduler.StepLR(optimizer,
                                                       step_size=25,
                                                       gamma=0.5)

    # Before we are getting started, let's get ready to give some feedback
    print("Dataset size: ", len(train_dataset))
    print("Sentence size:", train_dataset.sentence_size)
    print("Vocab set", [
        str(i) + ': ' + str(train_dataset.vocab[i])
        for i in range(len(train_dataset.vocab))
    ])

    # Prepare Visdom
    Visdom.start()
    lr_plt = Visdom.Plot2D("Curent learning rate",
                           store_interval=1,
                           xlabel="Epochs",
                           ylabel="Learning Rate")
    # TODO: Check legend
    train_loss = Visdom.Plot2D("Loss on Train Data",
                               store_interval=1,
                               xlabel="iteration",
                               ylabel="loss",
                               legend=['one', 2, 'three'])
    train_accuracy = Visdom.Plot2D("Accuracy on Train Data",
                                   store_interval=1,
                                   xlabel="iteration",
                                   ylabel="accuracy")
    validation_loss = Visdom.Plot2D("Loss on Validation Set",
                                    store_interval=1,
                                    xlabel="epoch",
                                    ylabel="loss")
    validation_accuracy = Visdom.Plot2D("Accuracy on Validation Set",
                                        store_interval=1,
                                        xlabel="epoch",
                                        ylabel="accuracy")
    babi_text_plt = Visdom.Text("Network Output")
    train_plots = {'loss': train_loss, 'accuracy': train_accuracy}
    val_plots = {'text': babi_text_plt}

    epoch = 0

    # Register Variables and plots to save
    saver = Saver(os.path.join(args.output_path, args.name),
                  short_interval=args.save_interval)
    saver.register('train_loss', StateSaver(train_loss))
    saver.register('train_accuracy', StateSaver(train_accuracy))
    saver.register('validation_loss', StateSaver(validation_loss))
    saver.register('validation_accuracy', StateSaver(validation_accuracy))
    saver.register('lr_plot', StateSaver(lr_plt))
    saver.register("model", StateSaver(model))
    saver.register("optimizer", StateSaver(optimizer))
    saver.register("epoch", GlobalVarSaver('epoch'))
    # saver.register("train_dataset", StateSaver(train_dataset))
    # saver.register("val_dataset", StateSaver(val_dataset))

    eval_on_start = False
    print("Given model argument to load from: ", args.load_model)
    # TODO: Load learning rate scheduler
    if args.load_model:
        if not saver.load(args.load_model):
            #  model.reset_parameters()
            print('Not loading, something went wrong', args.load_model)
            pass
        else:
            eval_on_start = False

    start_epoch = epoch
    end_epoch = start_epoch + args.epochs
    model.to(args.device)

    # TODO: Use saver only on full epochs or use it on certain iteration
    """ TRAIN START """
    # Eval on Start
    if eval_on_start:
        val_result = val_dataset.eval(args, model, plots=val_plots)
        validation_loss.add_point(0, val_result['loss'])
        validation_accuracy.add_point(0, val_result['accuracy'])
        saver.write(epoch)
    for epoch in range(start_epoch, end_epoch):
        train_result = train_dataset.test(args,
                                          model,
                                          optimizer,
                                          epoch=epoch,
                                          plots=train_plots,
                                          scheduler=lr_scheduler)
        val_result = val_dataset.eval(args,
                                      model,
                                      epoch=epoch + 1,
                                      plots=val_plots)
        validation_loss.add_point(epoch, val_result['loss'])
        validation_accuracy.add_point(epoch, val_result['accuracy'])

        current_lr = None
        for param_group in optimizer.param_groups:
            current_lr = param_group['lr']
            break
        lr_plt.add_point(epoch, current_lr if current_lr else 0)

        saver.tick(epoch + 1)
        if not args.cyc_lr:
            lr_scheduler.step()

        # TODO: Add writer
        # Log
        if epoch % args.save_interval == 0 or epoch == args.epochs - 1:
            for param_group in optimizer.param_groups:
                log_lr = param_group['lr']
                break

            log = 'Epoch: [{epoch}]\t Train Loss {tl} Acc {ta}\t Val Loss {vl} Acc {va} lr {lr}'.format(
                epoch=epoch,
                tl=round(train_result['loss'], 3),
                ta=round(train_result['accuracy'], 3),
                vl=round(val_result['loss'], 3),
                va=round(val_result['accuracy'], 3),
                lr=log_lr)
            print(log)

示例#5

0

显示文件

文件： main.py 项目： jinhuli/emotionAnalysis

    df = pd.read_excel('./data/sourceData/test.xlsx')
    new_df = df[['_id', '_id_x', '_id_y', 'nick_name', 'content']]
    nationalism_predictions = []
    for index, each in tqdm(new_df.iterrows()):
        nationalism_predictions.append(
            weibo_id_prediction_dic.get(int(each["_id"]), ""))
    new_df['{}_prediction'.format(
        CURRENT_MODEL_NAME)] = nationalism_predictions
    new_df.to_excel('./predictionResults/{}_prediction_result.xlsx'.format(
        CURRENT_MODEL_NAME))


if __name__ == "__main__":
    if IS_TRAIN:
        model = LSTM(INPUT_DIM, EMBEDDING_DIM, HIDDEN_DIM, OUTPUT_DIM,
                     BATCH_SIZE)
    else:
        model = torch.load(
            './trainedModel/best_{}_model.pkl'.format(CURRENT_MODEL_NAME))
        print('load model successfully')
    optimizer = optim.Adam(model.parameters(), lr=LEARNING_RATE)
    criterion = nn.BCEWithLogitsLoss()
    device = torch.device('cuda')
    model = model.to(device)
    criterion = criterion.to(device)
    if IS_TRAIN:
        for i in range(5):
            train(model, train_iterator, optimizer, criterion)
    else:
        test(model, test_iterator)