Python RetinaNet Examples

Programming Language: Python

Namespace/Package Name: model.retinanet

Class/Type: RetinaNet

Examples at hotexamples.com: 11

Python RetinaNet - 11 examples found. These are the top rated real world Python examples of model.retinanet.RetinaNet extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

RetinaNet(11)

load_state_dict(6)

cuda(4)

parameters(4)

eval(3)

state_dict(2)

compile(1)

fit(1)

modules(1)

named_parameters(1)

train(1)

Example #1

Show file

def main():
    lr = 5e-4
    gamma = 0.2
    num_classes = 21
    epoch = 300
    batch_size = 1
    # data_path = '/mnt/storage/project/data/VOCdevkit/VOC2007'
    data_path = '~/datasets/VOC/VOCdevkit/VOC2007'

    # define data.
    data_set = LoadVocDataSets(data_path, 'trainval', AnnotationTransform(),
                               PreProcess(resize=(600, 600)))

    # define model
    model = RetinaNet(num_classes)

    # define criterion
    criterion = FocalLoss(num_classes)

    # define optimizer
    optimizer = optim.SGD(model.parameters(),
                          lr=lr,
                          momentum=0.9,
                          weight_decay=5e-4)

    # set iteration numbers.
    epoch_size = len(data_set) // batch_size
    max_iter = epoch_size * epoch

    train_loss = 0
    # start iteration
    for iteration in range(max_iter):
        if iteration % epoch_size == 0:
            # create batch iterator
            batch_iter = iter(
                DataLoader(data_set,
                           batch_size,
                           shuffle=True,
                           num_workers=6,
                           collate_fn=data_set.detection_collate))
        images, loc_targets, cls_targets = next(batch_iter)
        optimizer.zero_grad()
        loc_preds, cls_preds = model(images)
        loss = criterion(loc_preds, loc_targets, cls_preds, cls_targets)
        loss.backward()
        optimizer.step()

        train_loss += loss.item()
        print('train_loss: %.3f ' % (loss.item()))

Example #2

Show file

File: test.py Project: feicay/retina-bdd

def test():
    print('initializing network...')
    network = RetinaNet(3, 10, 9)
    checkpoint = torch.load(args.pth)
    network.load_state_dict(checkpoint['net'])
    network = network.cuda().eval()
    if args.onnx:
        dummy_input = torch.randn(1, 3, 416, 416, device='cuda')
        torch.onnx.export(network, dummy_input, "retina-bdd.onnx", verbose=True)
        return
    class_names = ["bus","traffic light","traffic sign","person","bike","truck","motor","car","train","rider"]

    image = args.img
    img_tail =  image.split('.')[-1] 
    if img_tail == 'jpg' or img_tail =='jpeg' or img_tail == 'png':
        detect_image(image, network, args.thresh, class_names)   
    elif img_tail == 'mp4' or img_tail =='mkv' or img_tail == 'avi' or img_tail =='0':
        detect_vedio(image, network, args.thresh, class_names)
    else:
        print('unknow image type!!!')

Example #3

Show file

def import_pretrained_resnet():
    if config.base_conv_layer == 'resnet50':
        conv_layer = models.resnet50(pretrained=True)
    elif config.base_conv_layer == 'resnet101':
        conv_layer = models.resnet101(pretrained=True)

    print('Loading pretrained {} into {}.'.format(config.base_conv_layer,
                                                  config.model_name))

    if config.model_name == 'fpn101':
        fpn = FPN101()
    else:
        fpn = FPN50()

    conv_layer_states = conv_layer.state_dict()
    fpn_states = fpn.state_dict()

    for k in conv_layer_states.keys():
        if not k.startswith('fc'):  # skip fc layers
            fpn_states[k] = conv_layer_states[k]

    print('Initializing RetinaNet with {}.'.format(config.model_name))
    net = RetinaNet()
    for m in net.modules():
        if isinstance(m, nn.Conv2d):
            nn.init.normal_(m.weight, mean=0, std=0.01)
            if m.bias is not None:
                nn.init.constant_(m.bias, 0)
        elif isinstance(m, nn.BatchNorm2d):
            m.weight.data.fill_(1)
            m.bias.data.zero_()

    pi = 0.01
    nn.init.constant_(net.cls_head[-1].bias, -1 * math.log((1 - pi) / pi))

    net.fpn.load_state_dict(fpn_states)

    if not os.path.exists(os.path.dirname(config.pretrained_filename)):
        os.makedirs(os.path.dirname(config.pretrained_filename))
    torch.save(net.state_dict(), config.pretrained_filename)
    print('Finished.\nSaved in: {}'.format(config.pretrained_filename))

Example #4

Show file

def run_test():
    print('Loading model..')
    net = RetinaNet(args.num_classes)

    ckpt = torch.load(args.checkpoint)
    net.load_state_dict(ckpt['net'])
    net.eval()
    net.cuda()

    transform = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))
    ])

    print('Loading image..')
    img = Image.open(args.img_path)
    w, h = img.size

    print('Predicting..')
    x = transform(img)
    x = x.unsqueeze(0)
    with torch.no_grad():
        loc_preds, cls_preds = net(x.cuda())

        print('Decoding..')
        encoder = DataEncoder()
        boxes, labels, scores = encoder.decode(loc_preds.cpu().data.squeeze(),
                                               cls_preds.cpu().data.squeeze(),
                                               (w, h))

        label_map = load_pickled_label_map()

        draw = ImageDraw.Draw(img, 'RGBA')
        fnt = ImageFont.truetype('Pillow/Tests/fonts/DejaVuSans.ttf', 11)
        for idx in range(len(boxes)):
            box = boxes[idx]
            label = labels[idx]
            draw.rectangle(list(box), outline=(255, 0, 0, 200))

            item_tag = '{0}: {1:.2f}'.format(label_map[label.item()],
                                             scores[idx])
            iw, ih = fnt.getsize(item_tag)
            ix, iy = list(box[:2])
            draw.rectangle((ix, iy, ix + iw, iy + ih), fill=(255, 0, 0, 100))
            draw.text(list(box[:2]),
                      item_tag,
                      font=fnt,
                      fill=(255, 255, 255, 255))

        img.save(os.path.join('./rst', 'rst.png'), 'PNG')

Example #5

Show file

def train():
    max_epoch = 120
    lr = 0.001
    step_epoch = 50
    lr_decay = 0.1
    train_batch_size = 64
    val_batch_size = 16
    if args.vis:
        vis = visdom.Visdom(env=u'test1')
    #dataset
    print('importing dataset...')
    substep = args.substep
    trainset = bdd.bddDataset(416, 416)
    loader_train = data.DataLoader(trainset,
                                   batch_size=train_batch_size // substep,
                                   shuffle=1,
                                   num_workers=4,
                                   drop_last=True)
    valset = bdd.bddDataset(416, 416, train=0)
    loader_val = data.DataLoader(valset,
                                 batch_size=val_batch_size // substep,
                                 shuffle=1,
                                 num_workers=4,
                                 drop_last=True)
    #model
    print('initializing network...')
    network = RetinaNet(3, 10, 9)
    if args.resume:
        print('Resuming from checkpoint..')
        checkpoint = torch.load('./checkpoint/retina-bdd-backup.pth')
        network.load_state_dict(checkpoint['net'])
        best_loss = checkpoint['loss']
        start_epoch = checkpoint['epoch']
    else:
        start_epoch = 0
    if args.ngpus > 1:
        net = torch.nn.DataParallel(network).cuda()
    else:
        net = network.cuda()
    #criterion
    criterion = FocalLoss(10, 4, 9)
    optimizer = optim.Adam(net.parameters(), lr=lr, weight_decay=1e-4)
    #start training
    for i in range(start_epoch, max_epoch):
        print('--------start training epoch %d --------' % i)
        trainset.seen = 0
        valset.seen = 0
        loss_train = 0.0
        net.train()
        t0 = time.time()
        optimizer.zero_grad()
        for ii, (image, cls_truth, box_truth) in enumerate(loader_train):
            image = Variable(image).cuda()
            cls_truth = Variable(cls_truth).cuda()
            box_truth = Variable(box_truth).cuda()
            #forward
            cls_pred, box_pred = net(image)
            #loss
            loss = criterion(cls_pred, box_pred, cls_truth, box_truth)
            #backward
            loss.backward()
            #update
            if (ii + 1) % substep == 0:
                optimizer.step()
                optimizer.zero_grad()
            loss_train += loss.data
            #print('forward time: %f, loss time: %f, backward time: %f, update time: %f'%((t1-t0),(t2-t1),(t3-t2),(t4-t3)))
            print('%3d/%3d => loss: %f, cls_loss: %f, box_loss: %f' %
                  (ii, i, criterion.loss, criterion.cls_loss,
                   criterion.box_loss))
            if args.vis:
                vis.line(Y=loss.data.cpu().view(1, 1).numpy(),
                         X=np.array([ii]),
                         win='loss',
                         update='append' if ii > 0 else None)
        t1 = time.time()
        print('---one training epoch time: %fs---' % ((t1 - t0)))
        if i < 3:
            loss_train = loss.data
        else:
            loss_train = loss_train / ii
        loss_val = 0.0
        net.eval()
        for jj, (image, cls_truth, box_truth) in enumerate(loader_val):
            image = Variable(image).cuda()
            cls_truth = Variable(cls_truth).cuda()
            box_truth = Variable(box_truth).cuda()
            optimizer.zero_grad()
            cls_pred, box_pred = net(image)
            loss = criterion(cls_pred, box_pred, cls_truth, box_truth)
            loss_val += loss.data
            print('val: %3d/%3d => loss: %f, cls_loss: %f, box_loss: %f' %
                  (jj, i, criterion.loss, criterion.cls_loss,
                   criterion.box_loss))
        loss_val = loss_val / jj
        if args.vis:
            vis.line(Y=torch.cat((loss_val.view(1,1), loss_train.view(1,1)),1).cpu().numpy(),X=np.array([i]),\
                        win='eval-train loss',update='append' if i>0 else None)
        print('Saving weights...')
        if args.ngpus > 1:
            state = {
                'net': net.module.state_dict(),
                'loss': loss_val,
                'epoch': i,
            }
        else:
            state = {
                'net': net.state_dict(),
                'loss': loss_val,
                'epoch': i,
            }
        if not os.path.isdir('checkpoint'):
            os.mkdir('checkpoint')
        if (i + 1) % 10 == 0:
            torch.save(state, './checkpoint/retina-bdd-%03d.pth' % i)
        torch.save(state, './checkpoint/retina-bdd-backup.pth')
        if (i + 1) % step_epoch == 0:
            lr = lr * lr_decay
            print('learning rate: %f' % lr)
            optimizer = optim.Adam(net.parameters(), lr=lr, weight_decay=1e-4)
    torch.save(network, 'retina-bdd_final.pkl')
    print('finished training!!!')

Example #6

Show file

File: train_sem_se_syn.py Project: templeblock/Semantic_Segmentation_Cityscapes

def train(args):
    weight_dir = args.log_root  # os.path.join(args.log_root, 'weights')
    log_dir = os.path.join(
        args.log_root, 'logs',
        'SS-Net-{}'.format(time.strftime("%Y-%m-%d-%H-%M-%S",
                                         time.localtime())))

    data_dir = os.path.join(args.data_root, args.dataset)

    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    # 1. Setup DataLoader
    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    print("> # +++++++++++++++++++++++++++++++++++++++++++++++++++++++ #")
    print("> 0. Setting up DataLoader...")
    net_h, net_w = int(args.img_row * args.crop_ratio), int(args.img_col *
                                                            args.crop_ratio)
    augment_train = Compose([
        RandomHorizontallyFlip(),
        RandomSized((0.5, 0.75)),
        RandomRotate(5),
        RandomCrop((net_h, net_w))
    ])
    augment_valid = Compose([
        RandomHorizontallyFlip(),
        Scale((args.img_row, args.img_col)),
        CenterCrop((net_h, net_w))
    ])

    train_loader = CityscapesLoader(data_dir,
                                    gt='gtFine',
                                    split='train',
                                    img_size=(args.img_row, args.img_col),
                                    is_transform=True,
                                    augmentations=augment_train)

    valid_loader = CityscapesLoader(data_dir,
                                    gt='gtFine',
                                    split='val',
                                    img_size=(args.img_row, args.img_col),
                                    is_transform=True,
                                    augmentations=augment_valid)

    num_classes = train_loader.n_classes

    tra_loader = data.DataLoader(train_loader,
                                 batch_size=args.batch_size,
                                 num_workers=int(multiprocessing.cpu_count() /
                                                 2),
                                 shuffle=True)

    val_loader = data.DataLoader(valid_loader,
                                 batch_size=args.batch_size,
                                 num_workers=int(multiprocessing.cpu_count() /
                                                 2))

    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    # 2. Setup Model
    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    print("> # +++++++++++++++++++++++++++++++++++++++++++++++++++++++ #")
    print("> 1. Setting up Model...")
    model = RetinaNet(num_classes=num_classes, input_size=(net_h, net_w))
    # model = torch.nn.DataParallel(model, device_ids=[0,1,2]).cuda()
    model = DataParallelModel(model,
                              device_ids=args.device_ids).cuda()  # multi-gpu

    # 2.1 Setup Optimizer
    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    # Check if model has custom optimizer
    if hasattr(model.module, 'optimizer'):
        print('> Using custom optimizer')
        optimizer = model.module.optimizer
    else:
        optimizer = torch.optim.SGD(model.parameters(),
                                    lr=args.learning_rate,
                                    momentum=0.90,
                                    weight_decay=5e-4,
                                    nesterov=True)
        # optimizer = torch.optim.Adam(model.parameters(), lr=args.learning_rate, weight_decay=1e-5)

    # scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=4, gamma=0.1)
    # scheduler = torch.optim.lr_scheduler.ExponentialLR(optimizer, gamma=0.9)

    # 2.2 Setup Loss
    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    class_weight = np.array([
        0.05570516, 0.32337477, 0.08998544, 1.03602707, 1.03413147, 1.68195437,
        5.58540548, 3.56563995, 0.12704978, 1., 0.46783719, 1.34551528,
        5.29974114, 0.28342531, 0.9396095, 0.81551811, 0.42679146, 3.6399074,
        2.78376194
    ],
                            dtype=float)
    class_weight = torch.from_numpy(class_weight).float().cuda()

    sem_loss = bootstrapped_cross_entropy2d
    sem_loss = DataParallelCriterion(sem_loss, device_ids=args.device_ids)
    se_loss = SemanticEncodingLoss(num_classes=19,
                                   ignore_label=250,
                                   alpha=0.50).cuda()
    se_loss_parallel = DataParallelCriterion(se_loss,
                                             device_ids=args.device_ids)
    """
    # multi-gpu
    bootstrapped_cross_entropy2d = ContextBootstrappedCELoss2D(num_classes=num_classes,
                                                               ignore=250,
                                                               kernel_size=5,
                                                               padding=4,
                                                               dilate=2,
                                                               use_gpu=True)
    loss_sem = DataParallelCriterion(bootstrapped_cross_entropy2d, device_ids=[0, 1]) 
    """

    # 2.3 Setup Metrics
    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    # !!!!! Here Metrics !!!!!
    metrics = RunningScore(num_classes)  # num_classes = 93

    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    # 3. Resume Model
    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    print("> # +++++++++++++++++++++++++++++++++++++++++++++++++++++++ #")
    print("> 2. Model state init or resume...")
    args.start_epoch = 1
    args.start_iter = 0
    beat_map = 0.
    if args.resume is not None:
        full_path = os.path.join(os.path.join(weight_dir, 'train_model'),
                                 args.resume)
        if os.path.isfile(full_path):
            print("> Loading model and optimizer from checkpoint '{}'".format(
                args.resume))

            checkpoint = torch.load(full_path)

            args.start_epoch = checkpoint['epoch']
            args.start_iter = checkpoint['iter']
            beat_map = checkpoint['beat_map']
            model.load_state_dict(checkpoint['model_state'])  # weights
            optimizer.load_state_dict(
                checkpoint['optimizer_state'])  # gradient state
            del checkpoint

            print("> Loaded checkpoint '{}' (epoch {}, iter {})".format(
                args.resume, args.start_epoch, args.start_iter))

        else:
            print("> No checkpoint found at '{}'".format(full_path))
            raise Exception("> No checkpoint found at '{}'".format(full_path))
    else:
        # init_weights(model, pi=0.01,
        #              pre_trained=os.path.join(args.log_root, 'resnet50_imagenet.pth'))

        if args.pre_trained is not None:
            print("> Loading weights from pre-trained model '{}'".format(
                args.pre_trained))
            full_path = os.path.join(args.log_root, args.pre_trained)

            pre_weight = torch.load(full_path)
            prefix = "module.fpn.base_net."

            model_dict = model.state_dict()
            pretrained_dict = {(prefix + k): v
                               for k, v in pre_weight.items()
                               if (prefix + k) in model_dict}

            model_dict.update(pretrained_dict)
            model.load_state_dict(model_dict)

            del pre_weight
            del model_dict
            del pretrained_dict

    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    # 4. Train Model
    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    # 4.0. Setup tensor-board for visualization
    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    writer = None
    if args.tensor_board:
        writer = SummaryWriter(log_dir=log_dir, comment="SSnet_Cityscapes")
        # dummy_input = Variable(torch.rand(1, 3, args.img_row, args.img_col).cuda(), requires_grad=True)
        # writer.add_graph(model, dummy_input)

    print("> # +++++++++++++++++++++++++++++++++++++++++++++++++++++++ #")
    print("> 3. Model Training start...")
    topk_init = 512
    num_batches = int(
        math.ceil(
            len(tra_loader.dataset.files[tra_loader.dataset.split]) /
            float(tra_loader.batch_size)))

    # lr_period = 20 * num_batches

    for epoch in np.arange(args.start_epoch - 1, args.num_epochs):
        # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
        # 4.1 Mini-Batch Training
        # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
        model.train()
        topk_base = topk_init

        if epoch == args.start_epoch - 1:
            pbar = tqdm(np.arange(args.start_iter, num_batches))
            start_iter = args.start_iter
        else:
            pbar = tqdm(np.arange(num_batches))
            start_iter = 0

        lr = args.learning_rate

        # lr = adjust_learning_rate(optimizer, init_lr=args.learning_rate, decay_rate=0.1, curr_epoch=epoch,
        #                           epoch_step=20, start_decay_at_epoch=args.start_decay_at_epoch,
        #                           total_epoch=args.num_epochs, mode='exp')

        # scheduler.step()
        # for train_i, (images, gt_masks) in enumerate(tra_loader):  # One mini-Batch datasets, One iteration
        for train_i, (images, gt_masks) in zip(range(start_iter, num_batches),
                                               tra_loader):

            full_iter = (epoch * num_batches) + train_i + 1

            lr = poly_lr_scheduler(optimizer,
                                   init_lr=args.learning_rate,
                                   iter=full_iter,
                                   lr_decay_iter=1,
                                   max_iter=args.num_epochs * num_batches,
                                   power=0.9)

            # lr = args.learning_rate * cosine_annealing_lr(lr_period, full_iter)
            # optimizer = set_optimizer_lr(optimizer, lr)

            images = images.cuda().requires_grad_()
            se_labels = se_loss.unique_encode(gt_masks)
            se_labels = se_labels.cuda()
            gt_masks = gt_masks.cuda()

            topk_base = poly_topk_scheduler(init_topk=topk_init,
                                            iter=full_iter,
                                            topk_decay_iter=1,
                                            max_iter=args.num_epochs *
                                            num_batches,
                                            power=0.95)

            optimizer.zero_grad()

            se, sem_seg_pred = model(images)

            # --------------------------------------------------- #
            # Compute loss
            # --------------------------------------------------- #
            topk = topk_base * 512
            train_loss = sem_loss(input=sem_seg_pred,
                                  target=gt_masks,
                                  K=topk,
                                  weight=None)
            train_se_loss = se_loss_parallel(predicts=se,
                                             enc_cls_target=se_labels,
                                             size_average=True,
                                             reduction='elementwise_mean')

            loss = train_loss + args.alpha * train_se_loss
            loss.backward()  # back-propagation

            torch.nn.utils.clip_grad_norm_(model.parameters(), 1e3)
            optimizer.step()  # parameter update based on the current gradient

            pbar.update(1)
            pbar.set_description("> Epoch [%d/%d]" %
                                 (epoch + 1, args.num_epochs))
            pbar.set_postfix(Train_Loss=train_loss.item(),
                             Train_SE_Loss=train_se_loss.item(),
                             TopK=topk_base)
            # pbar.set_postfix(Train_Loss=train_loss.item(), TopK=topk_base)

            # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
            # 4.1.1 Verbose training process
            # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
            if (train_i + 1) % args.verbose_interval == 0:
                # ---------------------------------------- #
                # 1. Training Losses
                # ---------------------------------------- #
                loss_log = "Epoch [%d/%d], Iter: %d Loss1: \t %.4f " % (
                    epoch + 1, args.num_epochs, train_i + 1, loss.item())

                # ---------------------------------------- #
                # 2. Training Metrics
                # ---------------------------------------- #
                sem_seg_pred = F.softmax(sem_seg_pred, dim=1)
                pred = sem_seg_pred.data.max(1)[1].cpu().numpy()
                gt = gt_masks.data.cpu().numpy()

                metrics.update(
                    gt,
                    pred)  # accumulate the metrics (confusion_matrix and ious)
                score, _ = metrics.get_scores()

                metric_log = ""
                for k, v in score.items():
                    metric_log += " {}: \t %.4f, ".format(k) % v
                metrics.reset()  # reset the metrics for each train_i steps

                logs = loss_log + metric_log

                if args.tensor_board:
                    writer.add_scalar('Training/Train_Loss', train_loss.item(),
                                      full_iter)
                    writer.add_scalar('Training/Train_SE_Loss',
                                      train_se_loss.item(), full_iter)
                    writer.add_scalar('Training/Loss', loss.item(), full_iter)
                    writer.add_scalar('Training/Lr', lr, full_iter)
                    writer.add_scalars('Training/Metrics', score, full_iter)
                    writer.add_text('Training/Text', logs, full_iter)

                    for name, param in model.named_parameters():
                        writer.add_histogram(name,
                                             param.clone().cpu().data.numpy(),
                                             full_iter)
            """
            # each 2000 iterations save model
            if (train_i + 1) % args.iter_interval_save_model == 0:
                pbar.set_postfix(Loss=train_loss.item(), lr=lr)

                state = {"epoch": epoch + 1,
                         "iter": train_i + 1,
                         'beat_map': beat_map,
                         "model_state": model.state_dict(),
                         "optimizer_state": optimizer.state_dict()}

                save_dir = os.path.join(os.path.join(weight_dir, 'train_model'),
                                        "ssnet_model_sem_se_{}epoch_{}iter.pkl".format(epoch+1, train_i+1))
                torch.save(state, save_dir)
            """

        # end of this training phase
        state = {
            "epoch": epoch + 1,
            "iter": num_batches,
            'beat_map': beat_map,
            "model_state": model.state_dict(),
            "optimizer_state": optimizer.state_dict()
        }

        save_dir = os.path.join(
            os.path.join(args.log_root, 'train_model'),
            "ssnet_model_sem_se_{}_{}epoch_{}iter.pkl".format(
                args.model_details, epoch + 1, num_batches))
        torch.save(state, save_dir)

        # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
        # 4.2 Mini-Batch Validation
        # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
        model.eval()

        val_loss = 0.0
        vali_count = 0

        with torch.no_grad():
            for i_val, (images_val, gt_masks_val) in enumerate(val_loader):
                vali_count += 1

                images_val = images_val.cuda()
                se_labels_val = se_loss.unique_encode(gt_masks_val)
                se_labels_val = se_labels_val.cuda()
                gt_masks_val = gt_masks_val.cuda()

                se_val, sem_seg_pred_val = model(images_val)

                # !!!!!! Loss !!!!!!
                topk_val = topk_base * 512
                loss = sem_loss(sem_seg_pred_val, gt_masks_val, topk_val, weight=None) + \
                       args.alpha * se_loss_parallel(predicts=se_val, enc_cls_target=se_labels_val,
                                                     size_average=True, reduction='elementwise_mean')
                val_loss += loss.item()

                # accumulating the confusion matrix and ious
                sem_seg_pred_val = F.softmax(sem_seg_pred_val, dim=1)
                pred = sem_seg_pred_val.data.max(1)[1].cpu().numpy()
                gt = gt_masks_val.data.cpu().numpy()
                metrics.update(gt, pred)

            # ---------------------------------------- #
            # 1. Validation Losses
            # ---------------------------------------- #
            val_loss /= vali_count

            loss_log = "Epoch [%d/%d], Loss: \t %.4f" % (
                epoch + 1, args.num_epochs, val_loss)

            # ---------------------------------------- #
            # 2. Validation Metrics
            # ---------------------------------------- #
            metric_log = ""
            score, _ = metrics.get_scores()
            for k, v in score.items():
                metric_log += " {}: \t %.4f, ".format(k) % v
            metrics.reset()  # reset the metrics

            logs = loss_log + metric_log

            pbar.set_postfix(
                Vali_Loss=val_loss, Lr=lr,
                Vali_mIoU=score['Mean_IoU'])  # Train_Loss=train_loss.item()

            if args.tensor_board:
                writer.add_scalar('Validation/Loss', val_loss, epoch)
                writer.add_scalars('Validation/Metrics', score, epoch)
                writer.add_text('Validation/Text', logs, epoch)

                for name, param in model.named_parameters():
                    writer.add_histogram(name,
                                         param.clone().cpu().data.numpy(),
                                         epoch)

        # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
        # 4.3 End of one Epoch
        # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
        # !!!!! Here choose suitable Metric for the best model selection !!!!!

        if score['Mean_IoU'] >= beat_map:
            beat_map = score['Mean_IoU']
            state = {
                "epoch": epoch + 1,
                "beat_map": beat_map,
                "model_state": model.state_dict(),
                "optimizer_state": optimizer.state_dict()
            }

            save_dir = os.path.join(
                weight_dir,
                "SSnet_best_sem_se_{}_model.pkl".format(args.model_details))
            torch.save(state, save_dir)

        # Note that step should be called after validate()
        pbar.close()

    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    # 4.4 End of Training process
    # +++++++++++++++++++++++++++++++++++++++++++++++++++ #
    if args.tensor_board:
        # export scalar datasets to JSON for external processing
        # writer.export_scalars_to_json("{}/all_scalars.json".format(log_dir))
        writer.close()
    print("> # +++++++++++++++++++++++++++++++++++++++++++++++++++++++ #")
    print("> Training Done!!!")
    print("> # +++++++++++++++++++++++++++++++++++++++++++++++++++++++ #")

Example #7

Show file

DATASET_DIR = './dataset'
BATCH_SIZE = 1
MAX_SIZE = 320
MIN_SIZE = 320
NUM_WORKERS = 2
NUM_EPOCHS = 250
BASE_LR = 10e-4

train_dir = os.path.join(DATASET_DIR, 'stage1_train')

train_loader, val_loader = train_validation_loaders(train_dir,
                                                    min_size=MIN_SIZE,
                                                    max_size=MAX_SIZE,
                                                    validation_ratio=0.1,
                                                    batch_size=BATCH_SIZE,
                                                    num_workers=NUM_WORKERS,
                                                    pin_memory=True,
                                                    shuffle=True)

model = RetinaNet()

trainer = Trainer(model, force_single_gpu=False, lr=BASE_LR)

try:
    trainer.load_checkpoint(trainer.latest_checkpoint())
except RuntimeError as err:
    print("Warn: No checkpoints loaded.")
    print(err)

trainer.fit(train_loader, val_loader, num_epochs=NUM_EPOCHS)

Example #8

Show file

def run_train():
    assert torch.cuda.is_available(), 'Error: CUDA not found!'
    start_epoch = 0  # start from epoch 0 or last epoch

    # Data
    print('Load ListDataset')
    transform = transforms.Compose([
        transforms.ToTensor(),
        # transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))
    ])

    trainset = ListDataset(img_dir=config.img_dir,
                           list_filename=config.train_list_filename,
                           label_map_filename=config.label_map_filename,
                           train=True,
                           transform=transform,
                           input_size=config.img_res)
    trainloader = torch.utils.data.DataLoader(
        trainset,
        batch_size=config.train_batch_size,
        shuffle=True,
        num_workers=8,
        collate_fn=trainset.collate_fn)

    testset = ListDataset(img_dir=config.img_dir,
                          list_filename=config.test_list_filename,
                          label_map_filename=config.label_map_filename,
                          train=False,
                          transform=transform,
                          input_size=config.img_res)
    testloader = torch.utils.data.DataLoader(testset,
                                             batch_size=config.test_batch_size,
                                             shuffle=False,
                                             num_workers=8,
                                             collate_fn=testset.collate_fn)

    # Model
    net = RetinaNet()

    if os.path.exists(config.checkpoint_filename):
        print('Load saved checkpoint: {}'.format(config.checkpoint_filename))
        checkpoint = torch.load(config.checkpoint_filename)
        net.load_state_dict(checkpoint['net'])
        best_loss = checkpoint['loss']
        start_epoch = checkpoint['epoch']
    else:
        print('Load pretrained model: {}'.format(config.pretrained_filename))
        if not os.path.exists(config.pretrained_filename):
            import_pretrained_resnet()
        net.load_state_dict(torch.load(config.pretrained_filename))

    net = torch.nn.DataParallel(net,
                                device_ids=range(torch.cuda.device_count()))
    net.cuda()

    criterion = FocalLoss()
    optimizer = optim.SGD(net.parameters(),
                          lr=1e-3,
                          momentum=0.9,
                          weight_decay=1e-4)

    # Training
    def train(epoch):
        print('\nEpoch: %d' % epoch)
        net.train()
        net.module.freeze_bn()
        train_loss = 0

        total_batches = int(
            math.ceil(trainloader.dataset.num_samples /
                      trainloader.batch_size))

        for batch_idx, targets in enumerate(trainloader):
            inputs = targets[0]
            loc_targets = targets[1]
            cls_targets = targets[2]

            inputs = inputs.cuda()
            loc_targets = loc_targets.cuda()
            cls_targets = cls_targets.cuda()

            optimizer.zero_grad()
            loc_preds, cls_preds = net(inputs)
            loss = criterion(loc_preds, loc_targets, cls_preds, cls_targets)
            loss.backward()
            optimizer.step()

            train_loss += loss.data
            print('[%d| %d/%d] loss: %.3f | avg: %.3f' %
                  (epoch, batch_idx, total_batches, loss.data, train_loss /
                   (batch_idx + 1)))

    # Test
    def test(epoch):
        print('\nTest')
        net.eval()
        test_loss = 0

        total_batches = int(
            math.ceil(testloader.dataset.num_samples / testloader.batch_size))

        for batch_idx, targets in enumerate(testloader):
            inputs = targets[0]
            loc_targets = targets[1]
            cls_targets = targets[2]

            inputs = inputs.cuda()
            loc_targets = loc_targets.cuda()
            cls_targets = cls_targets.cuda()

            loc_preds, cls_preds = net(inputs)
            loss = criterion(loc_preds, loc_targets, cls_preds, cls_targets)
            test_loss += loss.data
            print('[%d| %d/%d] loss: %.3f | avg: %.3f' %
                  (epoch, batch_idx, total_batches, loss.data, test_loss /
                   (batch_idx + 1)))

        # Save checkpoint
        global best_loss
        test_loss /= len(testloader)
        if test_loss < best_loss:
            print('Save checkpoint: {}'.format(config.checkpoint_filename))
            state = {
                'net': net.module.state_dict(),
                'loss': test_loss,
                'epoch': epoch,
            }
            if not os.path.exists(os.path.dirname(config.checkpoint_filename)):
                os.makedirs(os.path.dirname(config.checkpoint_filename))
            torch.save(state, config.checkpoint_filename)
            best_loss = test_loss

    for epoch in range(start_epoch, start_epoch + 1000):
        train(epoch)
        test(epoch)

Example #9

Show file

    val_files = tf.data.Dataset.list_files('BDD100k/validation*')
    val_dataset = val_files.interleave(
        tf.data.TFRecordDataset,
        cycle_length=16,
        block_length=16,
        num_parallel_calls=tf.data.experimental.AUTOTUNE)
    val_dataset = val_dataset.map(
        load_data(INPUT_SHAPE),
        num_parallel_calls=tf.data.experimental.AUTOTUNE)
    val_dataset = val_dataset.batch(BATCH_SIZE, drop_remainder=True).repeat()
    val_dataset = val_dataset.prefetch(tf.data.experimental.AUTOTUNE)

with strategy.scope():
    model = RetinaNet(input_shape=INPUT_SHAPE,
                      n_classes=N_CLASSES,
                      training=True)
    optimizer = tf.keras.optimizers.Adam(learning_rate=LR, clipnorm=0.001)

    loss_dict = {'box': lambda x, y: y, 'focal': lambda x, y: y}
    callback_list = [
        tf.keras.callbacks.TensorBoard(log_dir='logs', update_freq='epoch'),
        tf.keras.callbacks.ModelCheckpoint('model_files/weights',
                                           save_weights_only=True,
                                           save_best_only=True,
                                           monitor='loss',
                                           verbose=1)
    ]
    model.compile(optimizer=optimizer, loss=loss_dict)
    model.fit(train_dataset,
              epochs=EPOCHS,

Example #10

Show file

File: train.py Project: Aruie/Retinanet_pytorch

def train(dataset, data_path, batch_size = 2, epochs = 1, mini = False) :


    # Make Dataloader
    if dataset == 'coco' :
        if 'images' not in os.listdir(data_path) :
            raise ValueError('"images" folder Not in Path')
    
        #dataloader_train = make_dataloader(coco_dir, 'train2017', batch_size = batch_size)    
        dataloader_val = make_dataloader(data_path, 'val2017', batch_size = batch_size)
        
    # Get device
    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') 

    # Make Model & Loss & optimizer
    model = RetinaNet(mini = mini).to(device)

    print(f'Parameter Count : {sum(p.numel() for p in model.parameters() if p.requires_grad)}')


    criterion = FocalLoss().to(device)
    optimizer = optim.SGD(model.parameters(), lr = 0.01, weight_decay=0.0001, momentum=0.9)

    for epoch in range(1, epochs + 1) :

        print(f'Epoch : {epoch:10}')

        losses = []

        for step, data in enumerate(dataloader_val) : 

            t00 = perf_counter()
            
            image = data['img'].to(device)
            annotation = data['annot'].to(device)

            t0 = perf_counter()
            print(f'data to device : {t0-t00}')

            classification, regression, anchors = model(image)

            t1 = perf_counter()
            print(f'model : {t1-t0}')

            loss_classification, loss_regression = criterion(classification, regression, anchors, annotation)
            loss = loss_classification + loss_regression

            t2 = perf_counter()
            print(f'criterion : {t2-t1}')
            
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

            t3 = perf_counter()
            print(f'backward : {t3-t2}\n')


            if step % 100 == 1 :
                print(f'\tStep : {step+1:3}', end='\t')
                print(f'Class : {loss_classification},  Box : {loss_regression}')

            losses.append(loss.item())

        print(f'Epochs {epoch:6}\t Train Loss : {sum(losses) / len(losses) : .4f}\t Val Loss : Not Yet ')

    torch.save(model, f'Ep{epochs}.pkl')

Example #11

Show file

File: deploy_model.py Project: templeblock/Semantic_Segmentation_Cityscapes

def test():
    net_h, net_w = 512, 512   # 512, 1024  768, 1536  896, 1792  1024, 2048
    # Setup image
    # print("Read Input Image from : {}".format(args.img_path))
    deploy_img_file = '/home/pingguo/PycharmProject/SSnet_cityscape/deploy/deploy_img'
    img_path = os.path.join(deploy_img_file, "frankfurt_000000_014480_leftImg8bit.png")
    mask_path = os.path.join(deploy_img_file, "frankfurt_000000_014480_gtFine_color.png")

    img = cv2.imread(img_path)
    img = img[:, :, ::-1]  # bgr --> rgb
    msk = cv2.imread(mask_path)
    msk = msk[:, :, ::-1]  # bgr --> rgb

    data_path = "/home/pingguo/PycharmProject/COCO"
    transform = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))
    ])
    loader = COCOStuffLoader(data_path, split='val', year="2017",
                             img_size=(net_h, net_w),
                             transform=transform, is_augment=None)
    n_classes = loader.num_classes
    im_mean = [0.485, 0.456, 0.406]
    im_std = [0.229, 0.224, 0.225]
    im_mean = np.array(im_mean).reshape([3, 1, 1])
    im_std = np.array(im_std).astype(float).reshape([3, 1, 1])

    # Setup Model
    print("> 1. Setting up Model...")
    model = RetinaNet(num_classes=n_classes, input_size=(net_h, net_w))
    model = torch.nn.DataParallel(model, device_ids=[1]).cuda()

    pre_weight = torch.load("/home/pingguo/PycharmProject/dl_project/Weights/PSnet/weights/{}".format(
        "psnet_model_sem.pkl"))
    pre_weight = pre_weight['model_state']
    model.load_state_dict(pre_weight)

    resized_img = cv2.resize(img, (loader.img_size[0], loader.img_size[1]), interpolation=cv2.INTER_CUBIC)
    resized_img = np.array(resized_img)

    # NHWC -> NCWH
    img = img.transpose(2, 0, 1)
    img = np.array(img, dtype=np.uint8)
    img = cv2.resize(img, (loader.img_size[0], loader.img_size[1]), interpolation=cv2.INTER_CUBIC)
    img = img.astype(np.float32)
    img = img.astype(np.float32) / 255.
    img -= im_mean
    img = img / im_std

    img = np.expand_dims(img, 0)
    img = torch.from_numpy(img).float
    img = img.unqueeze(0)

    model.eval()

    images = Variable(img.cuda(), volatile=True)

    start_time = time.time()
    outputs = F.softmax(model(images), dim=1)
    pred = np.squeeze(outputs.data.max(1)[1].cpu().numpy(), axis=0)
    print("Inference time: {}s".format(time.time()-start_time))

    # color map for predicted mask
    decoded = pred*255
    decoded = decoded.astype(np.uint8)

    img_msk = cv2.addWeighted(resized_img, 0.60, decoded, 0.40, 0)
    fun_classes = np.unique(pred)
    print('> {} Classes found: {}'.format(len(fun_classes), fun_classes))

    out_path = "/home/pingguo/PycharmProject/dl_project/PSnet/deploy/{}".format("000000000872_imgmsk.png")
    img_msk.save(out_path)
    out_path = "/home/pingguo/PycharmProject/dl_project/PSnet/deploy/{}".format("000000000872_msk.png")
    decoded.imsave(out_path)
    print("> Segmentation Mask Saved at: {}".format(out_path))

    msk = cv2.resize(msk, (loader.img_size[0], loader.img_size[1]))
    cv2.namedWindow("Org Mask", cv2.WINDOW_NORMAL)
    cv2.imshow("Org Mask", msk)
    cv2.namedWindow("Pre Mask", cv2.WINDOW_NORMAL)
    cv2.imshow("Pre Mask", decoded[:, :, ::-1])
    cv2.namedWindow("Image Mask", cv2.WINDOW_NORMAL)
    cv2.imshow("Image Mask", img_msk[:, :, ::-1])
    cv2.waitKey(0)