Python Learner.to_distributedの例

プログラミング言語: Python

名前空間/パッケージ名: fastai.basic_train

クラス/型: Learner

メソッド/関数: to_distributed

hotexamples.comのコード掲載数: 2

Python Learner.to_distributed - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのfastai.basic_train.Learner.to_distributedの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Learner(30)

fit_one_cycle(19)

fit(11)

split(8)

model(8)

freeze(8)

load(8)

unfreeze(7)

save(6)

validate(5)

predict(5)

loss_func(4)

create_opt(4)

show_results(4)

lr_range(4)

freeze_to(3)

get_preds(3)

lr_find(3)

layer_groups(2)

pred_batch(2)

to_distributed(2)

export(2)

opt(2)

clip_grad(1)

summary(1)

data(1)

opt_func(1)

model_dir(1)

coach(1)

dl(1)

callbacks(1)

coach_net(1)

coach_optim(1)

enable_coach(1)

metrics(1)

コード例 #1

ファイルを表示

def main():
    model = PSMNet(args.maxdisp, args.mindisp).cuda()
    if args.load_model is not None:
        if args.load is not None:
            warn('args.load is not None. load_model will be covered by load.')
        ckpt = torch.load(args.load_model, 'cpu')
        if 'model' in ckpt.keys():
            pretrained = ckpt['model']
        elif 'state_dict' in ckpt.keys():
            pretrained = ckpt['state_dict']
        else:
            raise RuntimeError()
        pretrained = {
            k.replace('module.', ''): v
            for k, v in pretrained.items()
        }
        model.load_state_dict(pretrained)
    train_dl = DataLoader(KITTIRoiDataset(args.data_dir, 'train',
                                          args.resolution, args.maxdisp,
                                          args.mindisp),
                          batch_size=args.batch_size,
                          shuffle=True,
                          num_workers=args.workers)
    val_dl = DataLoader(KITTIRoiDataset(args.data_dir, 'val', args.resolution,
                                        args.maxdisp, args.mindisp),
                        batch_size=args.batch_size,
                        num_workers=args.workers)

    loss_fn = PSMLoss()

    databunch = DataBunch(train_dl, val_dl, device='cuda')
    learner = Learner(databunch,
                      model,
                      loss_func=loss_fn,
                      model_dir=args.model_dir)
    learner.callbacks = [
        DistributedSaveModelCallback(learner),
        TensorBoardCallback(learner)
    ]
    if num_gpus > 1:
        learner.to_distributed(get_rank())
    if args.load is not None:
        learner.load(args.load)
    if args.mode == 'train':
        learner.fit(args.epochs, args.maxlr)
    elif args.mode == 'train_oc':
        fit_one_cycle(learner, args.epochs, args.maxlr)
    else:
        raise ValueError('args.mode not supported.')

コード例 #2

ファイルを表示

ファイル: snapshot_train.py プロジェクト: robinniesert/kaggle-champs

            lr=(args.lr, args.lr / args.lr_div),
            mom=(args.mom, 0.95),
            cycle_len=args.cycle_len,
            cycle_mult=args.cycle_mult,
            start_epoch=args.start_epoch)
]
learn = Learner(db,
                model,
                metrics=[rmse, mae],
                callback_fns=callback_fns,
                wd=args.wd,
                loss_func=contribs_rmse_loss)
if args.start_epoch > 0: learn.load(model_se_str + f'_{args.start_epoch-1}')
else: learn.load(model_str)
torch.cuda.empty_cache()
if distributed_train: learn = learn.to_distributed(args.local_rank)

learn.fit(args.epochs)

# make predictions
n_val = len(train_df[train_df['molecule_id'].isin(val_mol_ids)])
val_preds = np.zeros((n_val, args.epochs))
test_preds = np.zeros((len(test_df), args.epochs))
for m in range(args.epochs):
    print(f'Predicting for model {m}')
    learn.load(model_se_str + f'_{m}')
    val_contrib_preds = learn.get_preds(DatasetType.Valid)
    test_contrib_preds = learn.get_preds(DatasetType.Test)
    val_preds[:, m] = val_contrib_preds[0][:, -1].detach().numpy()
    test_preds[:, m] = test_contrib_preds[0][:, -1].detach().numpy()
val_preds = val_preds * C.SC_STD + C.SC_MEAN