Python MusicTransformer.state_dict示例

编程语言: Python

命名空间/包名称: model.music_transformer

类/类型: MusicTransformer

方法/功能: state_dict

hotexamples.com的示例: 2

Python MusicTransformer.state_dict - 已找到2个示例。这些是从开源项目中提取的最受好评的model.music_transformer.MusicTransformer.state_dict现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

load_state_dict(6)

eval(4)

generate(3)

MusicTransformer(2)

parameters(2)

state_dict(2)

示例#1

显示文件

文件： train.py 项目： SunDoge/MusicTransformer-Pytorch-1

def main():
    """
    ----------
    Author: Damon Gwinn
    ----------
    Entry point. Trains a model specified by command line arguments
    ----------
    """

    args = parse_train_args()
    print_train_args(args)

    if (args.force_cpu):
        use_cuda(False)
        print("WARNING: Forced CPU usage, expect model to perform slower")
        print("")

    os.makedirs(args.output_dir, exist_ok=True)

    # Output prep
    params_file = os.path.join(args.output_dir, "model_params.txt")
    write_model_params(args, params_file)

    weights_folder = os.path.join(args.output_dir, "weights")
    os.makedirs(weights_folder, exist_ok=True)

    results_folder = os.path.join(args.output_dir, "results")
    os.makedirs(results_folder, exist_ok=True)

    # Datasets
    train_dataset, val_dataset, test_dataset = create_epiano_datasets(
        args.input_dir, args.max_sequence)

    train_loader = DataLoader(train_dataset,
                              batch_size=args.batch_size,
                              num_workers=args.n_workers,
                              shuffle=True)
    val_loader = DataLoader(val_dataset,
                            batch_size=args.batch_size,
                            num_workers=args.n_workers)
    test_loader = DataLoader(test_dataset,
                             batch_size=args.batch_size,
                             num_workers=args.n_workers)

    model = MusicTransformer(n_layers=args.n_layers,
                             num_heads=args.num_heads,
                             d_model=args.d_model,
                             dim_feedforward=args.dim_feedforward,
                             dropout=args.dropout,
                             max_sequence=args.max_sequence,
                             rpr=args.rpr).to(get_device())

    # Continuing from previous training session
    start_epoch = 0
    if (args.continue_weights is not None):
        if (args.continue_epoch is None):
            print(
                "ERROR: Need epoch number to continue from (-continue_epoch) when using continue_weights"
            )
            return
        else:
            model.load_state_dict(torch.load(args.continue_weights))
            start_epoch = args.continue_epoch
    elif (args.continue_epoch is not None):
        print(
            "ERROR: Need continue weights (-continue_weights) when using continue_epoch"
        )
        return

    # Lr Scheduler vs static lr
    if (args.lr is None):
        if (args.continue_epoch is None):
            init_step = 0
        else:
            init_step = args.continue_epoch * len(train_loader)

        lr = LR_DEFAULT_START
        lr_stepper = LrStepTracker(args.d_model, SCHEDULER_WARMUP_STEPS,
                                   init_step)
    else:
        lr = args.lr

    # Not smoothing evaluation loss
    eval_loss = nn.CrossEntropyLoss(ignore_index=TOKEN_PAD)

    # SmoothCrossEntropyLoss or CrossEntropyLoss for training
    if (args.ce_smoothing is None):
        train_loss = eval_loss
    else:
        train_loss = SmoothCrossEntropyLoss(args.ce_smoothing,
                                            VOCAB_SIZE,
                                            ignore_index=TOKEN_PAD)

    # Optimizer
    opt = Adam(model.parameters(),
               lr=lr,
               betas=(ADAM_BETA_1, ADAM_BETA_2),
               eps=ADAM_EPSILON)

    if (args.lr is None):
        lr_scheduler = LambdaLR(opt, lr_stepper.step)
    else:
        lr_scheduler = None

    best_acc = 0.0
    best_acc_epoch = -1
    best_loss = float("inf")
    best_loss_epoch = -1

    # TRAIN LOOP
    for epoch in range(start_epoch, args.epochs):
        print(SEPERATOR)
        print("NEW EPOCH:", epoch + 1)
        print(SEPERATOR)
        print("")

        train_epoch(epoch + 1, model, train_loader, train_loss, opt,
                    lr_scheduler)

        print(SEPERATOR)
        print("Evaluating:")

        cur_loss, cur_acc = eval_model(model, test_loader, eval_loss)

        print("Avg loss:", cur_loss)
        print("Avg acc:", cur_acc)
        print(SEPERATOR)
        print("")

        if (cur_acc > best_acc):
            best_acc = cur_acc
            best_acc_epoch = epoch + 1
        if (cur_loss < best_loss):
            best_loss = cur_loss
            best_loss_epoch = epoch + 1

        epoch_str = str(epoch + 1).zfill(PREPEND_ZEROS_WIDTH)

        if ((epoch + 1) % args.weight_modulus == 0):
            path = os.path.join(weights_folder,
                                "epoch_" + epoch_str + ".pickle")
            torch.save(model.state_dict(), path)

        path = os.path.join(results_folder, "epoch_" + epoch_str + ".txt")
        o_stream = open(path, "w")
        o_stream.write(str(cur_acc) + "\n")
        o_stream.write(str(cur_loss) + "\n")
        o_stream.close()

    print(SEPERATOR)
    print("Best acc epoch:", best_acc_epoch)
    print("Best acc:", best_acc)
    print("")
    print("Best loss epoch:", best_loss_epoch)
    print("Best loss:", best_loss)

示例#2

显示文件

def main():
    """
    ----------
    Author: Damon Gwinn
    ----------
    Entry point. Trains a model specified by command line arguments
    ----------
    """

    args = parse_train_args()
    print_train_args(args)

    if (args.force_cpu):
        use_cuda(False)
        print("WARNING: Forced CPU usage, expect model to perform slower")
        print("")

    os.makedirs(args.output_dir, exist_ok=True)

    ##### Output prep #####
    params_file = os.path.join(args.output_dir, "model_params.txt")
    write_model_params(args, params_file)

    weights_folder = os.path.join(args.output_dir, "weights")
    os.makedirs(weights_folder, exist_ok=True)

    results_folder = os.path.join(args.output_dir, "results")
    os.makedirs(results_folder, exist_ok=True)

    results_file = os.path.join(results_folder, "results.csv")
    best_loss_file = os.path.join(results_folder, "best_loss_weights.pickle")
    best_acc_file = os.path.join(results_folder, "best_acc_weights.pickle")
    best_text = os.path.join(results_folder, "best_epochs.txt")

    ##### Tensorboard #####
    if (args.no_tensorboard):
        tensorboard_summary = None
    else:
        from torch.utils.tensorboard import SummaryWriter

        tensorboad_dir = os.path.join(args.output_dir, "tensorboard")
        tensorboard_summary = SummaryWriter(log_dir=tensorboad_dir)

    ##### Datasets #####
    train_dataset, val_dataset, test_dataset = create_epiano_datasets(
        args.input_dir, args.max_sequence)

    train_loader = DataLoader(train_dataset,
                              batch_size=args.batch_size,
                              num_workers=args.n_workers,
                              shuffle=True)
    val_loader = DataLoader(val_dataset,
                            batch_size=args.batch_size,
                            num_workers=args.n_workers)
    test_loader = DataLoader(test_dataset,
                             batch_size=args.batch_size,
                             num_workers=args.n_workers)

    model = MusicTransformer(n_layers=args.n_layers,
                             num_heads=args.num_heads,
                             d_model=args.d_model,
                             dim_feedforward=args.dim_feedforward,
                             dropout=args.dropout,
                             max_sequence=args.max_sequence,
                             rpr=args.rpr).to(get_device())

    ##### Continuing from previous training session #####
    start_epoch = BASELINE_EPOCH
    if (args.continue_weights is not None):
        if (args.continue_epoch is None):
            print(
                "ERROR: Need epoch number to continue from (-continue_epoch) when using continue_weights"
            )
            return
        else:
            model.load_state_dict(torch.load(args.continue_weights))
            start_epoch = args.continue_epoch
    elif (args.continue_epoch is not None):
        print(
            "ERROR: Need continue weights (-continue_weights) when using continue_epoch"
        )
        return

    ##### Lr Scheduler vs static lr #####
    if (args.lr is None):
        if (args.continue_epoch is None):
            init_step = 0
        else:
            init_step = args.continue_epoch * len(train_loader)

        lr = LR_DEFAULT_START
        lr_stepper = LrStepTracker(args.d_model, SCHEDULER_WARMUP_STEPS,
                                   init_step)
    else:
        lr = args.lr

    ##### Not smoothing evaluation loss #####
    eval_loss_func = nn.CrossEntropyLoss(ignore_index=TOKEN_PAD)

    ##### SmoothCrossEntropyLoss or CrossEntropyLoss for training #####
    if (args.ce_smoothing is None):
        train_loss_func = eval_loss_func
    else:
        train_loss_func = SmoothCrossEntropyLoss(args.ce_smoothing,
                                                 VOCAB_SIZE,
                                                 ignore_index=TOKEN_PAD)

    ##### Optimizer #####
    opt = Adam(model.parameters(),
               lr=lr,
               betas=(ADAM_BETA_1, ADAM_BETA_2),
               eps=ADAM_EPSILON)

    if (args.lr is None):
        lr_scheduler = LambdaLR(opt, lr_stepper.step)
    else:
        lr_scheduler = None

    ##### Tracking best evaluation accuracy #####
    best_eval_acc = 0.0
    best_eval_acc_epoch = -1
    best_eval_loss = float("inf")
    best_eval_loss_epoch = -1

    ##### Results reporting #####
    if (not os.path.isfile(results_file)):
        with open(results_file, "w", newline="") as o_stream:
            writer = csv.writer(o_stream)
            writer.writerow(CSV_HEADER)

    ##### TRAIN LOOP #####
    for epoch in range(start_epoch, args.epochs):
        # Baseline has no training and acts as a base loss and accuracy (epoch 0 in a sense)
        if (epoch > BASELINE_EPOCH):
            print(SEPERATOR)
            print("NEW EPOCH:", epoch + 1)
            print(SEPERATOR)
            print("")

            # Train
            train_epoch(epoch + 1, model, train_loader, train_loss_func, opt,
                        lr_scheduler, args.print_modulus)

            print(SEPERATOR)
            print("Evaluating:")
        else:
            print(SEPERATOR)
            print("Baseline model evaluation (Epoch 0):")

        # Eval
        train_loss, train_acc = eval_model(model, train_loader,
                                           train_loss_func)
        eval_loss, eval_acc = eval_model(model, test_loader, eval_loss_func)

        # Learn rate
        lr = get_lr(opt)

        print("Epoch:", epoch + 1)
        print("Avg train loss:", train_loss)
        print("Avg train acc:", train_acc)
        print("Avg eval loss:", eval_loss)
        print("Avg eval acc:", eval_acc)
        print(SEPERATOR)
        print("")

        new_best = False

        if (eval_acc > best_eval_acc):
            best_eval_acc = eval_acc
            best_eval_acc_epoch = epoch + 1
            torch.save(model.state_dict(), best_acc_file)
            new_best = True

        if (eval_loss < best_eval_loss):
            best_eval_loss = eval_loss
            best_eval_loss_epoch = epoch + 1
            torch.save(model.state_dict(), best_loss_file)
            new_best = True

        # Writing out new bests
        if (new_best):
            with open(best_text, "w") as o_stream:
                print("Best eval acc epoch:",
                      best_eval_acc_epoch,
                      file=o_stream)
                print("Best eval acc:", best_eval_acc, file=o_stream)
                print("")
                print("Best eval loss epoch:",
                      best_eval_loss_epoch,
                      file=o_stream)
                print("Best eval loss:", best_eval_loss, file=o_stream)

        if (not args.no_tensorboard):
            tensorboard_summary.add_scalar("Avg_CE_loss/train",
                                           train_loss,
                                           global_step=epoch + 1)
            tensorboard_summary.add_scalar("Avg_CE_loss/eval",
                                           eval_loss,
                                           global_step=epoch + 1)
            tensorboard_summary.add_scalar("Accuracy/train",
                                           train_acc,
                                           global_step=epoch + 1)
            tensorboard_summary.add_scalar("Accuracy/eval",
                                           eval_acc,
                                           global_step=epoch + 1)
            tensorboard_summary.add_scalar("Learn_rate/train",
                                           lr,
                                           global_step=epoch + 1)
            tensorboard_summary.flush()

        if ((epoch + 1) % args.weight_modulus == 0):
            epoch_str = str(epoch + 1).zfill(PREPEND_ZEROS_WIDTH)
            path = os.path.join(weights_folder,
                                "epoch_" + epoch_str + ".pickle")
            torch.save(model.state_dict(), path)

        with open(results_file, "a", newline="") as o_stream:
            writer = csv.writer(o_stream)
            writer.writerow(
                [epoch + 1, lr, train_loss, train_acc, eval_loss, eval_acc])

    # Sanity check just to make sure everything is gone
    if (not args.no_tensorboard):
        tensorboard_summary.flush()

    return