Python ModelSaver.save_ckpt_if_bestの例

プログラミング言語: Python

名前空間/パッケージ名: utils

クラス/型: ModelSaver

メソッド/関数: save_ckpt_if_best

hotexamples.comのコード掲載数: 2

Python ModelSaver.save_ckpt_if_best - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのutils.ModelSaver.save_ckpt_if_bestの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

ModelSaver(11)

save(2)

save_ckpt_if_best(2)

load_ckpt(1)

save_if_best(1)

save_models(1)

コード例 #1

ファイルを表示

    saver = ModelSaver(model_path, init_val=0)
    offset_ep = 1
    offset_ep = saver.load_ckpt(model, optimizer, device)
    if offset_ep > CONFIG.hyperparam.misc.max_epoch:
        raise RuntimeError(
            "trying to restart at epoch {} while max training is set to {} \
            epochs".format(offset_ep, CONFIG.hyperparam.misc.max_epoch))
    ########################################################

    if torch.cuda.device_count() > 1:
        model = nn.DataParallel(model)

    if CONFIG.use_wandb:
        wandb.watch(model)

    ################### training loop #####################
    for ep in range(offset_ep - 1, CONFIG.hyperparam.misc.max_epoch):
        print("global {} | begin training for epoch {}".format(
            global_timer, ep + 1))
        train_epoch(train_loader, model, optimizer, device, ep, CONFIG)
        print(
            "global {} | done with training for epoch {}, beginning validation"
            .format(global_timer, ep + 1))
        metrics = validate(val_loader, model, tokenizer, evaluator, device,
                           CONFIG)
        if "METEOR" in metrics.keys():
            saver.save_ckpt_if_best(model, optimizer, metrics["METEOR"])
        print("global {} | end epoch {}".format(global_timer, ep + 1))
    print("done training!")
    #######################################################

コード例 #2

ファイルを表示

ファイル: train.py プロジェクト: skasai5296/image_captioning

        offset_ep = saver.load_ckpt(model, optimizer, device)
        if offset_ep > CONFIG.max_epoch:
            logging.error("trying to restart at epoch {} while max training is set to {} epochs".format(offset_ep, CONFIG.max_epoch))
            sys.exit(1)
    criterion = nn.CrossEntropyLoss(ignore_index=tokenizer.padidx)
    if torch.cuda.device_count() > 1:
        model = nn.DataParallel(model)
    logging.debug("done!")

    logging.debug("loading evaluator...")
    #evaluator = BleuComputer()
    evaluator = NLGEval(metrics_to_omit=["METEOR"]) # meteor has problems, so omit
    logging.debug("done!")

    for ep in range(offset_ep-1, CONFIG.max_epoch):
        logging.info("global {} | begin training for epoch {}".format(global_timer, ep+1))
        train_epoch(train_loader, model, optimizer, criterion, device, tb_logger, ep)
        logging.info("global {} | done with training for epoch {}, beginning validation".format(global_timer, ep+1))
        metrics = validate(val_loader, model, tokenizer, evaluator, device)
        for key, val in metrics.items():
            tb_logger.add_scalar("metrics/{}".format(key), val, ep+1)
        if "Bleu_4" in metrics.keys():
            saver.save_ckpt_if_best(model, optimizer, metrics["Bleu_4"])
        logging.info("global {} | end epoch {}".format(global_timer, ep+1))
    logging.info("done training!!")