cross_val.py

import pandas as pd
from torch.cuda import empty_cache
import numpy as np
from nn.zoo.unet import SCSEUnet
from torch.utils.data import DataLoader
from config import use_sampler, use_adaptive_sampler, fp16, epochs_minlr, loss_name, predict_by_epochs, new_augs, parse_args
from utils.support_func import *
from nn.trainer import *
from nn.predicter import *
import segmentation_models_pytorch as smp
import gc
from dataset.dataloader import KidneySampler, KidneyLoader, ValLoader
import tifffile as tiff
from torch.optim import AdamW, Adam
from torch.nn import BCEWithLogitsLoss, DataParallel
import os
import apex
import h5py
from sklearn.model_selection import KFold


def train_fold(val_index, X_images, Masks, image_dims, fold, train=True, predict=True):
    positive_idxs, negative_idxs = get_indexes(val_index, X_images, Masks, image_dims, size, step_size, t=0.01)
    kid_sampler = KidneySampler(positive_idxs, negative_idxs, not_empty_ratio)
    train_dataset = KidneyLoader(X_images, Masks, image_dims, positive_idxs, False, size, step_size=step_size,
                                 val_index=val_index, new_augs=new_augs, augumentations=augumentations,
                                 size_after_reshape=size_after_reshape)
    val_dataset = KidneyLoader(X_images, Masks, image_dims, positive_idxs, True, size, val_index=val_index,
                               new_augs=new_augs, size_after_reshape=size_after_reshape)
    if not use_sampler:
        print("Use full dataset")
        trainloader = DataLoader(train_dataset, batch_size=bs, shuffle=True, num_workers=16)
    else:
        print("Use sample dataset")
        trainloader = DataLoader(train_dataset, batch_size=bs, shuffle=False, num_workers=16, sampler=kid_sampler)
    valloader = DataLoader(val_dataset, batch_size=bs * 2, shuffle=False, num_workers=16)
    x, y, key = train_dataset[10]
    print(len(trainloader), len(valloader))
    if seg_model_name == 'unet':
        print('Use unet model')
        model = smp.Unet(encoder, encoder_weights="imagenet", in_channels=3, classes=1,
                         decoder_use_batchnorm=False).cuda()
    elif seg_model_name == 'unet++':
        print('Use unet++ model')
        model = smp.UnetPlusPlus(encoder, encoder_weights="imagenet", in_channels=3, classes=1,
                                 decoder_use_batchnorm=False).cuda()
    elif seg_model_name == 'albunet':
        print('Use albunet model')
        from nn.trainer import AlbuNet
        model = AlbuNet(num_classes=1, pretrained=True).cuda()
    elif seg_model_name == 'scseunet':
        print('Use SCSEUnet model')
        model = SCSEUnet(seg_classes=1).cuda()
    else:
        print('Model name is incorrect. Set to unet++')
        model = smp.UnetPlusPlus(encoder, encoder_weights="imagenet", in_channels=3, classes=1,
                                 decoder_use_batchnorm=False).cuda()
    if parallel:
        model = DataParallel(model).cuda()

    if loss_name == 'comboloss':
        print("Use combo loss")
        loss = ComboLoss(weights=weights)
    else:
        print("Use BCE Loss")
        loss = BCEWithLogitsLoss()
    optim = AdamW(model.parameters(), lr=max_lr)
    if fp16:
        model, optimizer = apex.amp.initialize(
            model,
            optim,
            opt_level='O1')
    scheduler_params_cos = dict(
        T_max=epochs, eta_min=min_lr
    )
    scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optim, **scheduler_params_cos)
    # ---- Start train loop here ----- #
    print('Start train')
    min_val_loss = 100
    max_val_dice = -100
    best_dice_epochs = []
    if train:
        for epoch in range(epochs + epochs_minlr):
            with open(f"../{model_name}/{model_name}.log", 'a+') as logger:
                logger.write(f"Epoch # {epoch}, lr = {optim.param_groups[0]['lr']}\n")
            empty_cache()
            dice = 0
            print(f"epoch number {epoch}, lr = {optim.param_groups[0]['lr']}")
            if use_sampler & use_adaptive_sampler:
                if epoch < 10:
                    kid_sampler = KidneySampler(positive_idxs, negative_idxs, 0.2)
                    trainloader = DataLoader(train_dataset, batch_size=bs,
                                             shuffle=False, num_workers=16, sampler=kid_sampler)
                else:

                    kid_sampler = KidneySampler(positive_idxs, negative_idxs, 0.5)
                    trainloader = DataLoader(train_dataset, batch_size=bs,
                                             shuffle=False, num_workers=16, sampler=kid_sampler)

            model, optim, pred_keys, final_masks, \
            train_loss, train_dice = train_one_epoch(model, optim, trainloader, size, loss, store_train_masks=False)
            print(f"train loss = {train_loss}")
            del pred_keys, final_masks
            gc.collect()
            model, optim, val_keys, val_masks, val_loss = val_one_epoch(model, optim, valloader, size, loss)
            print(f"val loss = {val_loss}")
            if epoch < epochs:
                scheduler.step()
            m = 0
            for img_number in val_index:
                _, val_dice = calculate_dice(Masks, val_keys, val_masks, img_number, size, image_dims)
                with open(f"../{model_name}/{model_name}.log", 'a+') as logger:
                    logger.write(f'dice on image {img_number} = {val_dice} ')
                print(f'dice on image {img_number} = {val_dice}')
                m += val_dice
            with open(f"../{model_name}/{model_name}.log", 'a+') as logger:
                logger.write(f'\n')
            val_dice = m / len(val_index)
            if predict_by_epochs != 'best':
                if len(best_dice_epochs) < predict_by_epochs:
                    best_dice_epochs.append((epoch, val_dice))
                    #save(model.state_dict(), f"../{model_name}/{model_name}_{epoch}_{fold}.h5")
                    print('Best epochs updated. ', best_dice_epochs)
                else:
                    ind = np.argmin([el[1] for el in best_dice_epochs])
                    if best_dice_epochs[ind][1] < val_dice:
                        best_dice_epochs[ind] = (epoch, val_dice)
                        save(model.state_dict(), f"../{model_name}/{model_name}_{epoch}_{fold}.h5")
                        print('Best epochs updated. ', best_dice_epochs)
                    else:
                        print('No change in best epochs: ', best_dice_epochs)
            # val_dice = calc_average_dice(Masks, val_keys, val_masks, val_index, image_dims, size)
            if val_dice > max_val_dice:
                max_val_dice = val_dice
                save(model.state_dict(), f"../{model_name}/{model_name}_{epoch}_{fold}.h5")
                save(model.state_dict(), f"../{model_name}/last_best_model.h5")

            print("Dice on train micro ", train_dice)
            print(f"Dice on val (average) = {val_dice}")
            with open(f"../{model_name}/{model_name}.log", 'a+') as logger:
                logger.write(f'train loss = {train_loss}, train dice (micro) = {train_dice}\n')
                logger.write(f'validation loss = {val_loss}, val dice = {val_dice}\n')
                logger.write('\n')
            del val_keys, val_masks
            gc.collect()
            print("=====================")
        with open(f"../{model_name}/{model_name}.log", 'a+') as logger:
            logger.write(f'Best epochs = {best_dice_epochs}\n')
        model.load_state_dict(load(f"../{model_name}/last_best_model.h5"))
        val_keys, val_masks = predict_data(model, valloader, size, True)
        #val_dice = calc_average_dice(Masks, val_keys, val_masks, val_index, image_dims, size)
        best_t, best_val_dice = search_for_best_threshold(Masks, val_keys, val_masks, val_index, image_dims, size)
        print(f"Dice on val (average) with TTA = {best_val_dice} with t = {best_t}")
        with open(f"../{model_name}/{model_name}.log", 'a+') as logger:
            logger.write(f'dice on val with TTA = {best_val_dice} with t = {best_t}\n')
        del val_keys, val_masks
        gc.collect()
    if predict:
        if not train:
            pass
            # if fold == 0:
            #     best_dice_epochs = [(34, 0.938852186919906), (39, 0.9393114299799262), (36, 0.9388174075553963), (38, 0.9389920761027962)]
            # elif fold == 1:
            #     best_dice_epochs = [(28, 0.9027552584839075), (36, 0.9033416557294215), (37, 0.9031257069334585), (38, 0.9029346479118595)]
            # elif fold == 2:
            #     best_dice_epochs = [(38, 0.9328974798970685), (33, 0.9329123230368631), (37, 0.9331401395093545), (39, 0.932692250874815)]
            # elif fold == 3:
            #     best_dice_epochs = [(31, 0.9388590937356484), (39, 0.9368731018176651), (30, 0.9372210758433651), (38, 0.9375657655754374)]
            # elif fold == 4:
            #     best_dice_epochs = [(37, 0.9372186165197486), (32, 0.9372384178794498), (36, 0.9372328533782275), (33, 0.9368665971919303)]

        sample_sub = pd.read_csv(data_path + 'sample_submission.csv')
        test_paths = sample_sub.id.values
        print('Start test')
        del X_images
        gc.collect()
        X_test_images = []
        img_dims_test = []
        for name in test_paths:
            img = tiff.imread(data_path + f"test/{name}.tiff")
            if img.shape[0] == 3:
                img = np.moveaxis(img, 0, 2)
            X_test_images.append(img)
            img_dims_test.append(img.shape)
            print(img.shape)
        del img
        gc.collect()

        test_dataset = ValLoader(X_test_images, img_dims_test, size, new_augs=new_augs,
                                 size_after_reshape=size_after_reshape, overlap=overlap, step_size=step_size)
        testloader = DataLoader(test_dataset, batch_size=bs * 2, shuffle=False, num_workers=16)
        if predict_by_epochs == 'best':
            model.load_state_dict(load(f'../{model_name}/last_best_model.h5'))
            test_masks, test_keys = predict_test(model, size, testloader, True)
            del X_test_images
            gc.collect()
            masks = []
            for n in range(len(sample_sub)):
                mask = make_masks(test_keys, test_masks, n, img_dims_test, size, overlap=overlap, step_size=step_size)
                masks.append(mask)
            return masks

        else:
            bled_masks = [np.zeros(s[:2]) for s in img_dims_test]
            for epoch in best_dice_epochs:
                print(f'Start predict for epoch {epoch[0]}')
                model.load_state_dict(load(f'../{model_name}/{model_name}_{epoch[0]}_{fold}.h5'))
                test_masks, test_keys = predict_test(model, size, testloader, True)
                for n in range(len(sample_sub)):
                    mask = make_masks(test_keys, test_masks, n, img_dims_test, size, overlap=overlap, step_size=step_size)
                    bled_masks[n] += mask / len(best_dice_epochs)

            del X_test_images
            gc.collect()
            if store_masks:
                for j, mask in enumerate(bled_masks):
                    with h5py.File(f'../{model_name}/{model_name}_mask_{j}_fold_{fold}.txt', "w") as f:
                        dset = f.create_dataset("mask", data=mask, dtype='f')
                    # np.savetxt(f'../{model_name}/{model_name}_mask_{j}.txt', mask)
            for tt in range(2, 7):
                all_enc = []
                t = tt/10
                for mask in bled_masks:
                    mask_c = mask.copy()
                    mask_c[mask_c < t] = 0
                    mask_c[mask_c >= t] = 1
                    enc = mask2enc(mask_c)
                    all_enc.append(enc[0])
                sample_sub.predicted = all_enc
                s = ''.join([str(e[0]) + '_' for e in best_dice_epochs])[:-1]
                sample_sub.to_csv(f'../{model_name}/mean_{model_name}_{s}_fold_{fold}_t_{t}_overlap_{overlap}.csv', index=False)

            return bled_masks
    else:
        return []


args = parse_args()
epochs = args.epochs
encoder = args.encoder
bs = args.bs
thr = args.thr
seg_model_name = args.seg_model_name
prefix = seg_model_name + f'_{encoder}'
max_lr = args.max_lr
 # fp16 = args.fp16
min_lr = args.min_lr
size = args.size
size_after_reshape = args.size_after_reshape
step_size_ratio = args.step_size_ratio
step_size = int(size * step_size_ratio)
gpu_number = args.gpu_number
loss_weights = args.loss_weights
store_masks = args.store_masks
cutmix = args.cutmix
not_empty_ratio = args.not_empty_ratio
parallel = args.parallel
predict = args.predict
overlap = args.overlap
train = args.train
augumentations = ['albu', 'cutmix'] if cutmix else None
weights = {"bce": int(loss_weights[0]), "dice": int(loss_weights[1]), "focal": int(loss_weights[2])}
s = 'w_'
for weight in weights:
    s += str(weights[weight])
    s += '-'
model_name = f'cross_val_{prefix}_{s}_{size}_{step_size}_{size_after_reshape}_{bs}_{epochs}_{max_lr}_cutmix_{cutmix}'
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ["CUDA_VISIBLE_DEVICES"] = str(gpu_number)
seed_everything(2021)
os.system(f"mkdir ../{str(model_name)}")
print('Start data preparation')

data_path = '../data/'
data = pd.read_csv(data_path + 'train.csv')
X_images_ = []
Masks_ = []
image_dims_ = []
for i in range(len(data)):
    img = tiff.imread(data_path + f"train/{data.id[i]}.tiff")
    if img.shape[0] == 1:
        img = img[0][0]
    if img.shape[0] == 3:
        img = np.moveaxis(img, 0, 2)
    X_images_.append(img)
    shape = (img.shape[1], img.shape[0])
    mask = enc2mask(data.loc[data.id == data.id[i], "encoding"].values[0], shape)
    Masks_.append(mask)
    image_dims_.append(img.shape)
    print(img.shape)

del img, mask, shape
gc.collect()

indexes = [i for i in range(15)]
kf = KFold(n_splits=5, shuffle=True, random_state=2021)
sum_masks = []
k = 0
for fold, (train_index, val_index_) in enumerate(kf.split(indexes)):
    print('Train fold ', fold, 'val indexes = ', val_index_)
    with open(f"../{model_name}/{model_name}.log", 'a+') as logger:
        logger.write(f'fold {fold} val index {val_index_}\n')
    masks = train_fold(val_index_, X_images_, Masks_, image_dims_, fold, train=train, predict=predict)
    if len(sum_masks) == 0:
        sum_masks = masks
    else:
        for i in range(len(sum_masks)):
            if predict:
                sum_masks[i] = sum_masks[i] + masks[i]
    k += 1
    del masks

del X_images_, Masks_, image_dims_
gc.collect()
sample_sub = pd.read_csv(data_path + 'sample_submission.csv')

sum_masks = [np.array(mask)/k for mask in sum_masks]
for j, mask in enumerate(sum_masks):
    with h5py.File(f'../{model_name}/{model_name}_mask_{j}_cross_val.txt', "w") as f:
        dset = f.create_dataset("mask", data=mask, dtype='f')
for tt in range(2, 7):
    t = tt/10
    all_enc = []
    for mask in sum_masks:
        mask_c = mask.copy()
        mask_c[mask_c < t] = 0
        mask_c[mask_c >= t] = 1
        enc = mask2enc(mask_c)
        all_enc.append(enc[0])
    sample_sub.predicted = all_enc
    sample_sub.to_csv(f'../{model_name}/{model_name}_t_{t}_overlap_{overlap}.csv', index=False)