Python MultiscaleDiscriminator.cuda 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: networks

메소드/함수: cuda

hotexamples.com에서의 예제들: 2

Python MultiscaleDiscriminator.cuda - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 networks.MultiscaleDiscriminator.cuda에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MultiscaleDiscriminator(7)

parameters(5)

apply(4)

cuda(2)

state_dict(2)

train(2)

eval(1)

to_gpu(1)

예제 #1

파일 보기

파일: train_real_fixed.py 프로젝트: EllisonFord/Background-Matting

netG = ResnetConditionHR(input_nc=(3, 3, 1, 4),
                         output_nc=4,
                         n_blocks1=args.n_blocks1,
                         n_blocks2=args.n_blocks2)
netG.apply(conv_init)
netG = nn.DataParallel(netG)
netG.cuda()
torch.backends.cudnn.benchmark = True

netD = MultiscaleDiscriminator(input_nc=3,
                               num_D=1,
                               norm_layer=nn.InstanceNorm2d,
                               ndf=64)
netD.apply(conv_init)
netD = nn.DataParallel(netD)
netD.cuda()

# Loss
l1_loss = alpha_loss()
c_loss = compose_loss()
g_loss = alpha_gradient_loss()
GAN_loss = GANloss()

optimizerG = optim.Adam(netG.parameters(), lr=1e-4)
optimizerD = optim.Adam(netD.parameters(), lr=1e-5)

log_writer = SummaryWriter(tb_dir)

print('Starting Training')
step = 50

예제 #2

파일 보기

def main():
    # CUDA

    # os.environ["CUDA_VISIBLE_DEVICES"]="4"
    # print('CUDA Device: ' + os.environ["CUDA_VISIBLE_DEVICES"])
    print(f'Is CUDA available: {torch.cuda.is_available()}')
    """Parses arguments."""
    parser = argparse.ArgumentParser(
        description='Training Background Matting on Adobe Dataset')
    parser.add_argument('-n',
                        '--name',
                        type=str,
                        help='Name of tensorboard and model saving folders')
    parser.add_argument('-bs', '--batch_size', type=int, help='Batch Size')
    parser.add_argument('-res',
                        '--reso',
                        type=int,
                        help='Input image resolution')
    parser.add_argument('-init_model',
                        '--init_model',
                        type=str,
                        help='Initial model file')

    parser.add_argument('-w',
                        '--workers',
                        type=int,
                        default=None,
                        help='Number of worker to load data')
    parser.add_argument('-ep',
                        '--epochs',
                        type=int,
                        default=15,
                        help='Maximum Epoch')
    parser.add_argument(
        '-n_blocks1',
        '--n_blocks1',
        type=int,
        default=7,
        help='Number of residual blocks after Context Switching')
    parser.add_argument('-n_blocks2',
                        '--n_blocks2',
                        type=int,
                        default=3,
                        help='Number of residual blocks for Fg and alpha each')

    args = parser.parse_args()
    if args.workers is None:
        args.workers = args.batch_size

    ##Directories
    tb_dir = f'tb_summary/{args.name}'
    model_dir = f'models/{args.name}'

    if not os.path.exists(model_dir):
        os.makedirs(model_dir)

    if not os.path.exists(tb_dir):
        os.makedirs(tb_dir)

    ## Input list
    data_config_train = {
        'reso': (args.reso, args.reso)
    }  # if trimap is true, rcnn is used

    # DATA LOADING
    print('\n[Phase 1] : Data Preparation')

    # Original Data
    traindata = VideoData(
        csv_file='Video_data_train.csv',
        data_config=data_config_train,
        transform=None
    )  # Write a dataloader function that can read the database provided by .csv file

    train_loader = DataLoader(traindata,
                              batch_size=args.batch_size,
                              shuffle=True,
                              num_workers=args.workers,
                              collate_fn=collate_filter_none)

    print('\n[Phase 2] : Initialization')

    netB = ResnetConditionHR(input_nc=(3, 3, 1, 4),
                             output_nc=4,
                             n_blocks1=args.n_blocks1,
                             n_blocks2=args.n_blocks2)
    netB = nn.DataParallel(netB)
    netB.load_state_dict(torch.load(args.init_model))
    netB.cuda()
    netB.eval()
    for param in netB.parameters():  # freeze netB
        param.requires_grad = False

    netG = ResnetConditionHR(input_nc=(3, 3, 1, 4),
                             output_nc=4,
                             n_blocks1=args.n_blocks1,
                             n_blocks2=args.n_blocks2)
    netG.apply(conv_init)
    netG = nn.DataParallel(netG)
    netG.cuda()
    torch.backends.cudnn.benchmark = True

    netD = MultiscaleDiscriminator(input_nc=3,
                                   num_D=1,
                                   norm_layer=nn.InstanceNorm2d,
                                   ndf=64)
    netD.apply(conv_init)
    netD = nn.DataParallel(netD)
    netD.cuda()

    # Loss
    l1_loss = alpha_loss()
    c_loss = compose_loss()
    g_loss = alpha_gradient_loss()
    GAN_loss = GANloss()

    optimizerG = Adam(netG.parameters(), lr=1e-4)
    optimizerD = Adam(netD.parameters(), lr=1e-5)

    log_writer = SummaryWriter(tb_dir)

    print('Starting Training')
    step = 50

    KK = len(train_loader)

    wt = 1
    for epoch in range(0, args.epochs):

        netG.train()
        netD.train()

        lG, lD, GenL, DisL_r, DisL_f, alL, fgL, compL, elapse_run, elapse = 0, 0, 0, 0, 0, 0, 0, 0, 0, 0

        t0 = get_time()

        for i, data in enumerate(train_loader):
            # Initiating
            bg = data['bg'].cuda()
            image = data['image'].cuda()
            seg = data['seg'].cuda()
            multi_fr = data['multi_fr'].cuda()
            seg_gt = data['seg-gt'].cuda()
            back_rnd = data['back-rnd'].cuda()

            mask0 = torch.ones(seg.shape).cuda()

            tr0 = get_time()

            # pseudo-supervision
            alpha_pred_sup, fg_pred_sup = netB(image, bg, seg, multi_fr)
            mask = (alpha_pred_sup > -0.98).type(torch.FloatTensor).cuda()

            mask1 = (seg_gt > 0.95).type(torch.FloatTensor).cuda()

            ## Train Generator

            alpha_pred, fg_pred = netG(image, bg, seg, multi_fr)

            ##pseudo-supervised losses
            al_loss = l1_loss(
                alpha_pred_sup, alpha_pred,
                mask0) + 0.5 * g_loss(alpha_pred_sup, alpha_pred, mask0)
            fg_loss = l1_loss(fg_pred_sup, fg_pred, mask)

            # compose into same background
            comp_loss = c_loss(image, alpha_pred, fg_pred, bg, mask1)

            # randomly permute the background
            perm = torch.LongTensor(np.random.permutation(bg.shape[0]))
            bg_sh = bg[perm, :, :, :]

            al_mask = (alpha_pred > 0.95).type(torch.FloatTensor).cuda()

            # Choose the target background for composition
            # back_rnd: contains separate set of background videos captured
            # bg_sh: contains randomly permuted captured background from the same minibatch
            if np.random.random_sample() > 0.5:
                bg_sh = back_rnd

            image_sh = compose_image_withshift(
                alpha_pred, image * al_mask + fg_pred * (1 - al_mask), bg_sh,
                seg)

            fake_response = netD(image_sh)

            loss_ganG = GAN_loss(fake_response, label_type=True)

            lossG = loss_ganG + wt * (0.05 * comp_loss + 0.05 * al_loss +
                                      0.05 * fg_loss)

            optimizerG.zero_grad()

            lossG.backward()
            optimizerG.step()

            # Train Discriminator

            fake_response = netD(image_sh)
            real_response = netD(image)

            loss_ganD_fake = GAN_loss(fake_response, label_type=False)
            loss_ganD_real = GAN_loss(real_response, label_type=True)

            lossD = (loss_ganD_real + loss_ganD_fake) * 0.5

            # Update discriminator for every 5 generator update
            if i % 5 == 0:
                optimizerD.zero_grad()
                lossD.backward()
                optimizerD.step()

            lG += lossG.data
            lD += lossD.data
            GenL += loss_ganG.data
            DisL_r += loss_ganD_real.data
            DisL_f += loss_ganD_fake.data

            alL += al_loss.data
            fgL += fg_loss.data
            compL += comp_loss.data

            log_writer.add_scalar('Generator Loss', lossG.data,
                                  epoch * KK + i + 1)
            log_writer.add_scalar('Discriminator Loss', lossD.data,
                                  epoch * KK + i + 1)
            log_writer.add_scalar('Generator Loss: Fake', loss_ganG.data,
                                  epoch * KK + i + 1)
            log_writer.add_scalar('Discriminator Loss: Real',
                                  loss_ganD_real.data, epoch * KK + i + 1)
            log_writer.add_scalar('Discriminator Loss: Fake',
                                  loss_ganD_fake.data, epoch * KK + i + 1)

            log_writer.add_scalar('Generator Loss: Alpha', al_loss.data,
                                  epoch * KK + i + 1)
            log_writer.add_scalar('Generator Loss: Fg', fg_loss.data,
                                  epoch * KK + i + 1)
            log_writer.add_scalar('Generator Loss: Comp', comp_loss.data,
                                  epoch * KK + i + 1)

            t1 = get_time()

            elapse += t1 - t0
            elapse_run += t1 - tr0
            t0 = t1

            if i % step == (step - 1):
                print(f'[{epoch + 1}, {i + 1:5d}] '
                      f'Gen-loss: {lG / step:.4f} '
                      f'Disc-loss: {lD / step:.4f} '
                      f'Alpha-loss: {alL / step:.4f} '
                      f'Fg-loss: {fgL / step:.4f} '
                      f'Comp-loss: {compL / step:.4f} '
                      f'Time-all: {elapse / step:.4f} '
                      f'Time-fwbw: {elapse_run / step:.4f}')
                lG, lD, GenL, DisL_r, DisL_f, alL, fgL, compL, elapse_run, elapse = 0, 0, 0, 0, 0, 0, 0, 0, 0, 0

                write_tb_log(image, 'image', log_writer, i)
                write_tb_log(seg, 'seg', log_writer, i)
                write_tb_log(alpha_pred_sup, 'alpha-sup', log_writer, i)
                write_tb_log(alpha_pred, 'alpha_pred', log_writer, i)
                write_tb_log(fg_pred_sup * mask, 'fg-pred-sup', log_writer, i)
                write_tb_log(fg_pred * mask, 'fg_pred', log_writer, i)

                # composition
                alpha_pred = (alpha_pred + 1) / 2
                comp = fg_pred * alpha_pred + (1 - alpha_pred) * bg
                write_tb_log(comp, 'composite-same', log_writer, i)
                write_tb_log(image_sh, 'composite-diff', log_writer, i)

                del comp

            del bg, image, seg, multi_fr, seg_gt, back_rnd
            del mask0, alpha_pred_sup, fg_pred_sup, mask, mask1
            del alpha_pred, fg_pred, al_loss, fg_loss, comp_loss
            del bg_sh, image_sh, fake_response, real_response
            del lossG, lossD, loss_ganD_real, loss_ganD_fake, loss_ganG

        if epoch % 2 == 0:
            ep = epoch + 1
            torch.save(netG.state_dict(), f'{model_dir}/netG_epoch_{ep}.pth')
            torch.save(optimizerG.state_dict(),
                       f'{model_dir}/optimG_epoch_{ep}.pth')
            torch.save(netD.state_dict(), f'{model_dir}/netD_epoch_{ep}.pth')
            torch.save(optimizerD.state_dict(),
                       f'{model_dir}/optimD_epoch_{ep}.pth')

            # Change weight every 2 epoch to put more stress on discriminator weight and less on pseudo-supervision
            wt = wt / 2