Python DataParallelWithCallback.load_state_dict示例

编程语言: Python

命名空间/包名称: sync_batchnorm

方法/功能: load_state_dict

hotexamples.com的示例: 4

Python DataParallelWithCallback.load_state_dict - 已找到4个示例。这些是从开源项目中提取的最受好评的sync_batchnorm.DataParallelWithCallback.load_state_dict现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

DataParallelWithCallback(30)

eval(16)

state_dict(7)

train(7)

parameters(5)

load_state_dict(4)

cuda(3)

named_parameters(1)

示例#1

显示文件

文件： main.py 项目： smartcai/Semi-Coupled-Structure-for-visual-sequental-tasks

if opt.resume or opt.test:
    print("loading model")
    checkpoint = torch.load(opt.model_path + '/' + opt.model_name,
                            map_location={
                                'cuda:0': 'cuda:' + str(opt.device_id[0]),
                                'cuda:1': 'cuda:' + str(opt.device_id[0]),
                                'cuda:2': 'cuda:' + str(opt.device_id[0]),
                                'cuda:3': 'cuda:' + str(opt.device_id[0]),
                                'cuda:4': 'cuda:' + str(opt.device_id[0]),
                                'cuda:5': 'cuda:' + str(opt.device_id[0]),
                                'cuda:6': 'cuda:' + str(opt.device_id[0]),
                                'cuda:7': 'cuda:' + str(opt.device_id[0])
                            })

    model.load_state_dict(checkpoint['model'], strict=True)
    try:
        optimizer.load_state_dict(checkpoint['opt'], strict=True)
    except:
        pass
    for group_id, param_group in enumerate(optimizer.param_groups):
        if group_id == 0:
            param_group['lr'] = opt.LR[0]
        elif group_id == 1:
            param_group['lr'] = opt.LR[0]
        elif group_id == 2:
            param_group['lr'] = opt.LR[1]
    resume_epoch = checkpoint['epoch']
    if 'step' in checkpoint:
        resume_step = checkpoint['step'] + 1
    if 'max_acc' in checkpoint:

示例#2

显示文件

文件： main.py 项目： Kitsunetic/Deep-RNN-Framework-1

def main():
    torch.backends.cudnn.enabled = True
    torch.backends.cudnn.benchmark = True

    parser = argparse.ArgumentParser()
    parser.add_argument('--LR',
                        type=list,
                        default=[1e-4, 1e-4],
                        help='learning rate')  # start from 1e-4
    parser.add_argument('--EPOCH', type=int, default=30, help='epoch')
    parser.add_argument('--slice_num',
                        type=int,
                        default=6,
                        help='how many slices to cut')
    parser.add_argument('--batch_size',
                        type=int,
                        default=40,
                        help='batch_size')
    parser.add_argument('--frame_num',
                        type=int,
                        default=5,
                        help='how many frames in a slice')
    parser.add_argument('--model_path',
                        type=str,
                        default='/Disk1/poli/models/DeepRNN/Kinetics_res18',
                        help='model_path')
    parser.add_argument('--model_name',
                        type=str,
                        default='checkpoint',
                        help='model name')
    parser.add_argument('--video_path',
                        type=str,
                        default='/home/poli/kinetics_scaled',
                        help='video path')
    parser.add_argument('--class_num', type=int, default=400, help='class num')
    parser.add_argument('--device_id',
                        type=list,
                        default=[0, 1, 2, 3],
                        help='learning rate')
    parser.add_argument('--resume', action='store_true', help='whether resume')
    parser.add_argument('--dropout',
                        type=list,
                        default=[0.2, 0.5],
                        help='dropout')
    parser.add_argument('--weight_decay',
                        type=float,
                        default=1e-4,
                        help='weight decay')
    parser.add_argument('--saveInter',
                        type=int,
                        default=1,
                        help='how many epoch to save once')
    parser.add_argument('--TD_rate',
                        type=float,
                        default=0.0,
                        help='propabaility of detachout')
    parser.add_argument('--img_size', type=int, default=224, help='image size')
    parser.add_argument('--syn_bn', action='store_true', help='use syn_bn')
    parser.add_argument('--logName',
                        type=str,
                        default='logs_res18',
                        help='log dir name')
    parser.add_argument('--train', action='store_true', help='train the model')
    parser.add_argument('--test', action='store_true', help='test the model')
    parser.add_argument(
        '--overlap_rate',
        type=float,
        default=0.25,
        help='the overlap rate of the overlap coherence training scheme')
    parser.add_argument('--lambdaa',
                        type=float,
                        default=0.0,
                        help='weight of the overlap coherence loss')

    opt = parser.parse_args()
    print(opt)

    torch.cuda.set_device(opt.device_id[0])

    # ######################## Module #################################
    print('Building model')
    model = actionModel(opt.class_num,
                        batch_norm=True,
                        dropout=opt.dropout,
                        TD_rate=opt.TD_rate,
                        image_size=opt.img_size,
                        syn_bn=opt.syn_bn,
                        test_scheme=3)
    print(model)
    if opt.syn_bn:
        model = DataParallelWithCallback(model,
                                         device_ids=opt.device_id).cuda()
    else:
        model = torch.nn.DataParallel(model, device_ids=opt.device_id).cuda()
    print("Channels: " + str(model.module.channels))

    # ########################Optimizer#########################
    optimizer = torch.optim.SGD([{
        'params': model.module.RNN.parameters(),
        'lr': opt.LR[0]
    }, {
        'params': model.module.ShortCut.parameters(),
        'lr': opt.LR[0]
    }, {
        'params': model.module.classifier.parameters(),
        'lr': opt.LR[1]
    }],
                                lr=opt.LR[1],
                                weight_decay=opt.weight_decay,
                                momentum=0.9)

    # ###################### Loss Function ####################################
    loss_classification_func = nn.NLLLoss(reduce=True)

    def loss_overlap_coherence_func(pre, cur):
        loss = nn.MSELoss()
        return loss(cur, pre.detach())

    # ###################### Resume ##########################################
    resume_epoch = 0
    resume_step = 0
    max_test_acc = 0

    if opt.resume or opt.test:
        print("loading model")
        checkpoint = torch.load(opt.model_path + '/' + opt.model_name,
                                map_location={
                                    'cuda:0': 'cuda:' + str(opt.device_id[0]),
                                    'cuda:1': 'cuda:' + str(opt.device_id[0]),
                                    'cuda:2': 'cuda:' + str(opt.device_id[0]),
                                    'cuda:3': 'cuda:' + str(opt.device_id[0]),
                                    'cuda:4': 'cuda:' + str(opt.device_id[0]),
                                    'cuda:5': 'cuda:' + str(opt.device_id[0]),
                                    'cuda:6': 'cuda:' + str(opt.device_id[0]),
                                    'cuda:7': 'cuda:' + str(opt.device_id[0])
                                })

        model.load_state_dict(checkpoint['model'], strict=True)
        try:
            optimizer.load_state_dict(checkpoint['opt'], strict=True)
        except:
            pass
        for group_id, param_group in enumerate(optimizer.param_groups):
            if group_id == 0:
                param_group['lr'] = opt.LR[0]
            elif group_id == 1:
                param_group['lr'] = opt.LR[0]
            elif group_id == 2:
                param_group['lr'] = opt.LR[1]
        resume_epoch = checkpoint['epoch']
        if 'step' in checkpoint:
            resume_step = checkpoint['step'] + 1
        if 'max_acc' in checkpoint:
            max_test_acc = checkpoint['max_acc']
        print('Finish Loading')
        del checkpoint
    # ###########################################################################

    # training and testing
    model.train()
    predict_for_mAP = []
    label_for_mAP = []

    print("START")

    KineticsLoader = torch.utils.data.DataLoader(
        Kinetic_train_dataset.Kinetics(video_path=opt.video_path +
                                       '/train_frames',
                                       frame_num=opt.frame_num,
                                       batch_size=opt.batch_size,
                                       img_size=opt.img_size,
                                       slice_num=opt.slice_num,
                                       overlap_rate=opt.overlap_rate),
        batch_size=1,
        shuffle=True,
        num_workers=8)
    Loader_test = torch.utils.data.DataLoader(Kinetics_test_dataset.Kinetics(
        video_path=opt.video_path + '/val_frames',
        img_size=224,
        space=5,
        split_num=8,
        lenn=60,
        num_class=opt.class_num),
                                              batch_size=64,
                                              shuffle=True,
                                              num_workers=4)
    tensorboard_writer = SummaryWriter(
        opt.logName,
        purge_step=resume_epoch * len(KineticsLoader) * opt.slice_num +
        (resume_step + resume_step) * opt.slice_num)
    test = opt.test
    for epoch in range(resume_epoch, opt.EPOCH):

        predict_for_mAP = []
        label_for_mAP = []

        for step, (x, _, overlap_frame_num,
                   action) in enumerate(KineticsLoader):  # gives batch data

            if opt.train:
                if step + resume_step >= len(KineticsLoader):
                    break
                x = x[0]
                action = action[0]
                overlap_frame_num = overlap_frame_num[0]

                c = [
                    Variable(
                        torch.from_numpy(
                            np.zeros(
                                (x.shape[1], model.module.channels[layer + 1],
                                 model.module.input_size[layer],
                                 model.module.input_size[layer]
                                 )))).cuda().float()
                    for layer in range(model.module.RNN_layer)
                ]
                for slice in range(x.shape[0]):
                    b_x = Variable(x[slice]).cuda()
                    b_action = Variable(action[slice]).cuda()

                    out, out_beforeMerge, c = model(b_x.float(),
                                                    c)  # rnn output
                    for batch in range(len(out)):
                        predict_for_mAP.append(out[batch].data.cpu().numpy())
                        label_for_mAP.append(
                            b_action[batch][-1].data.cpu().numpy())

                    # ###################### overlap coherence loss #######################################################################################
                    loss_coherence = torch.zeros(1).cuda()

                    # claculate the coherence loss with the previous clip and current clip
                    if slice != 0:
                        for b in range(out.size()[0]):
                            loss_coherence += loss_overlap_coherence_func(
                                old_overlap[b],
                                torch.exp(out_beforeMerge[
                                    b, :overlap_frame_num[slice, b, 0].int()]))
                        loss_coherence = loss_coherence / out.size()[0]

                    # record the previous clips output
                    old_overlap = []
                    for b in range(out.size()[0]):
                        old_overlap.append(
                            torch.exp(
                                out_beforeMerge[b,
                                                -overlap_frame_num[slice, b,
                                                                   0].int():]))
                    #######################################################################################################################################

                    loss_classification = loss_classification_func(
                        out, b_action[:, -1].long())

                    loss = loss_classification + opt.lambdaa * loss_coherence
                    tensorboard_writer.add_scalar(
                        'train/loss', loss,
                        epoch * len(KineticsLoader) * opt.slice_num +
                        (step + resume_step) * opt.slice_num + slice)

                    loss.backward(retain_graph=False)

                predict_for_mAP = predict_for_mAP
                label_for_mAP = label_for_mAP
                mAPs = mAP(predict_for_mAP, label_for_mAP, 'Lsm')
                acc = accuracy(predict_for_mAP, label_for_mAP, 'Lsm')
                tensorboard_writer.add_scalar(
                    'train/mAP', mAPs,
                    epoch * len(KineticsLoader) * opt.slice_num +
                    (step + resume_step) * opt.slice_num + slice)
                tensorboard_writer.add_scalar(
                    'train/acc', acc,
                    epoch * len(KineticsLoader) * opt.slice_num +
                    (step + resume_step) * opt.slice_num + slice)

                print("Epoch: " + str(epoch) + " step: " +
                      str(step + resume_step) + " Loss: " +
                      str(loss.data.cpu().numpy()) + " Loss_coherence: " +
                      str(loss_coherence.data.cpu().numpy()) + " mAP: " +
                      str(mAPs)[0:7] + " acc: " + str(acc)[0:7])

                for p in model.module.parameters():
                    p.grad.data.clamp_(min=-5, max=5)

                if step % 2 == 1:
                    optimizer.step()
                    optimizer.zero_grad()

                predict_for_mAP = []
                label_for_mAP = []

            # ################################### test ###############################
            if (step + resume_step) % 700 == 699:
                test = True

            if test:
                print('Start Test')
                TEST_LOSS = AverageMeter()
                with torch.no_grad():
                    model.eval()
                    predict_for_mAP = []
                    label_for_mAP = []
                    print("TESTING")

                    for step_test, (x, _, _, action) in tqdm(
                            enumerate(Loader_test)):  # gives batch data
                        b_x = Variable(x).cuda()
                        b_action = Variable(action).cuda()

                        c = [
                            Variable(
                                torch.from_numpy(
                                    np.zeros((len(b_x),
                                              model.module.channels[layer + 1],
                                              model.module.input_size[layer],
                                              model.module.input_size[layer]
                                              )))).cuda().float()
                            for layer in range(model.module.RNN_layer)
                        ]
                        out, _, _ = model(b_x.float(), c)  # rnn output
                        loss = loss_classification_func(
                            out, b_action[:, -1].long())
                        TEST_LOSS.update(val=loss.data.cpu().numpy())

                        for batch in range(len(out)):
                            predict_for_mAP.append(
                                out[batch].data.cpu().numpy())
                            label_for_mAP.append(
                                b_action[batch][-1].data.cpu().numpy())

                        if step_test % 50 == 0:
                            MAP = mAP(np.array(predict_for_mAP),
                                      np.array(label_for_mAP), 'Lsm')
                            acc = accuracy(np.array(predict_for_mAP),
                                           np.array(label_for_mAP), 'Lsm')
                            print(" Loss: " + str(TEST_LOSS.avg)[0:5] + '  ' +
                                  'accuracy: ' + str(acc)[0:7])

                    predict_for_mAP = np.array(predict_for_mAP)
                    label_for_mAP = np.array(label_for_mAP)

                    MAP = mAP(predict_for_mAP, label_for_mAP, 'Lsm')
                    acc = accuracy(predict_for_mAP, label_for_mAP, 'Lsm')

                    print("mAP: " + str(MAP) + '  ' + 'accuracy: ' + str(acc))

                    if acc > max_test_acc:
                        print('Saving')
                        max_test_acc = acc
                        torch.save(
                            {
                                'model': model.state_dict(),
                                'max_acc': max_test_acc,
                                'epoch': epoch,
                                'step': 0,
                                'opt': optimizer.state_dict()
                            }, opt.model_path + '/' + opt.model_name + '_' +
                            str(epoch) + '_' + str(max_test_acc)[0:6])
                    model.train()

                    test = False
                    predict_for_mAP = []
                    label_for_mAP = []

                    if opt.test:
                        exit()

        if epoch % opt.saveInter == 0:
            print('Saving')
            torch.save(
                {
                    'model': model.state_dict(),
                    'max_acc': max_test_acc,
                    'epoch': epoch,
                    'step': 0,
                    'opt': optimizer.state_dict()
                }, opt.model_path + '/' + opt.model_name + '_' + str(epoch))

        resume_step = 0

示例#3

显示文件

class Model:
    def __init__(self,
                 hidden_dim,
                 lr,
                 hard_or_full_trip,
                 margin,
                 num_workers,
                 batch_size,
                 restore_iter,
                 total_iter,
                 save_name,
                 train_pid_num,
                 frame_num,
                 model_name,
                 train_source,
                 test_source,
                 img_size=64):

        self.save_name = save_name
        self.train_pid_num = train_pid_num
        self.train_source = train_source
        self.test_source = test_source

        self.hidden_dim = hidden_dim
        self.lr = lr
        self.hard_or_full_trip = hard_or_full_trip
        self.margin = margin
        self.frame_num = frame_num
        self.num_workers = num_workers
        self.batch_size = batch_size
        self.model_name = model_name
        self.P, self.M = batch_size

        self.restore_iter = restore_iter
        self.total_iter = total_iter

        self.img_size = img_size

        self.encoder = SetNet(self.hidden_dim).float()
        self.encoder = DataParallelWithCallback(self.encoder)
        self.triplet_loss = TripletLoss(self.P * self.M, self.hard_or_full_trip, self.margin).float()
        self.triplet_loss = DataParallelWithCallback(self.triplet_loss)
        self.encoder.cuda()
        self.triplet_loss.cuda()

        self.optimizer = optim.Adam([
            {'params': self.encoder.parameters()},
        ], lr=self.lr)

        self.hard_loss_metric = []
        self.full_loss_metric = []
        self.full_loss_num = []
        self.dist_list = []
        self.mean_dist = 0.01

        self.sample_type = 'all'

    def collate_fn(self, batch):
        batch_size = len(batch)
        feature_num = len(batch[0][0])
        seqs = [batch[i][0] for i in range(batch_size)]
        frame_sets = [batch[i][1] for i in range(batch_size)]
        view = [batch[i][2] for i in range(batch_size)]
        seq_type = [batch[i][3] for i in range(batch_size)]
        label = [batch[i][4] for i in range(batch_size)]
        batch = [seqs, view, seq_type, label, None]

        def select_frame(index):
            sample = seqs[index]
            frame_set = frame_sets[index]
            if self.sample_type == 'random':
                frame_id_list = random.choices(frame_set, k=self.frame_num)
                _ = [feature.loc[frame_id_list].values for feature in sample]
            else:
                _ = [feature.values for feature in sample]
            return _

        seqs = list(map(select_frame, range(len(seqs))))

        if self.sample_type == 'random':
            seqs = [np.asarray([seqs[i][j] for i in range(batch_size)]) for j in range(feature_num)]
        else:
            gpu_num = min(torch.cuda.device_count(), batch_size)
            batch_per_gpu = math.ceil(batch_size / gpu_num)
            batch_frames = [[
                                len(frame_sets[i])
                                for i in range(batch_per_gpu * _, batch_per_gpu * (_ + 1))
                                if i < batch_size
                                ] for _ in range(gpu_num)]
            if len(batch_frames[-1]) != batch_per_gpu:
                for _ in range(batch_per_gpu - len(batch_frames[-1])):
                    batch_frames[-1].append(0)
            max_sum_frame = np.max([np.sum(batch_frames[_]) for _ in range(gpu_num)])
            seqs = [[
                        np.concatenate([
                                           seqs[i][j]
                                           for i in range(batch_per_gpu * _, batch_per_gpu * (_ + 1))
                                           if i < batch_size
                                           ], 0) for _ in range(gpu_num)]
                    for j in range(feature_num)]
            seqs = [np.asarray([
                                   np.pad(seqs[j][_],
                                          ((0, max_sum_frame - seqs[j][_].shape[0]), (0, 0), (0, 0)),
                                          'constant',
                                          constant_values=0)
                                   for _ in range(gpu_num)])
                    for j in range(feature_num)]
            batch[4] = np.asarray(batch_frames)

        batch[0] = seqs
        return batch

    def fit(self):
        if self.restore_iter != 0:
            self.load(self.restore_iter)

        self.encoder.train()
        self.sample_type = 'random'
        for param_group in self.optimizer.param_groups:
            param_group['lr'] = self.lr
        triplet_sampler = TripletSampler(self.train_source, self.batch_size)
        train_loader = tordata.DataLoader(
            dataset=self.train_source,
            batch_sampler=triplet_sampler,
            collate_fn=self.collate_fn,
            num_workers=self.num_workers)

        train_label_set = list(self.train_source.label_set)
        train_label_set.sort()

        _time1 = datetime.now()
        for seq, view, seq_type, label, batch_frame in train_loader:
            self.restore_iter += 1
            self.optimizer.zero_grad()

            for i in range(len(seq)):
                seq[i] = self.np2var(seq[i]).float()
            if batch_frame is not None:
                batch_frame = self.np2var(batch_frame).int()

            feature, label_prob = self.encoder(*seq, batch_frame)

            target_label = [train_label_set.index(l) for l in label]
            target_label = self.np2var(np.array(target_label)).long()

            triplet_feature = feature.permute(1, 0, 2).contiguous()
            triplet_label = target_label.unsqueeze(0).repeat(triplet_feature.size(0), 1)
            (full_loss_metric, hard_loss_metric, mean_dist, full_loss_num
             ) = self.triplet_loss(triplet_feature, triplet_label)
            if self.hard_or_full_trip == 'hard':
                loss = hard_loss_metric.mean()
            elif self.hard_or_full_trip == 'full':
                loss = full_loss_metric.mean()

            self.hard_loss_metric.append(hard_loss_metric.mean().data.cpu().numpy())
            self.full_loss_metric.append(full_loss_metric.mean().data.cpu().numpy())
            self.full_loss_num.append(full_loss_num.mean().data.cpu().numpy())
            self.dist_list.append(mean_dist.mean().data.cpu().numpy())

            if loss > 1e-9:
                loss.backward()
                self.optimizer.step()

            if self.restore_iter % 1000 == 0:
                print(datetime.now() - _time1)
                _time1 = datetime.now()

            if self.restore_iter % 100 == 0:
                self.save()
                print('iter {}:'.format(self.restore_iter), end='')
                print(', hard_loss_metric={0:.8f}'.format(np.mean(self.hard_loss_metric)), end='')
                print(', full_loss_metric={0:.8f}'.format(np.mean(self.full_loss_metric)), end='')
                print(', full_loss_num={0:.8f}'.format(np.mean(self.full_loss_num)), end='')
                self.mean_dist = np.mean(self.dist_list)
                print(', mean_dist={0:.8f}'.format(self.mean_dist), end='')
                print(', lr=%f' % self.optimizer.param_groups[0]['lr'], end='')
                print(', hard or full=%r' % self.hard_or_full_trip)
                sys.stdout.flush()
                self.hard_loss_metric = []
                self.full_loss_metric = []
                self.full_loss_num = []
                self.dist_list = []

            # Visualization using t-SNE
            # if self.restore_iter % 500 == 0:
            #     pca = TSNE(2)
            #     pca_feature = pca.fit_transform(feature.view(feature.size(0), -1).data.cpu().numpy())
            #     for i in range(self.P):
            #         plt.scatter(pca_feature[self.M * i:self.M * (i + 1), 0],
            #                     pca_feature[self.M * i:self.M * (i + 1), 1], label=label[self.M * i])
            #
            #     plt.show()

            if self.restore_iter == self.total_iter:
                break

    def ts2var(self, x):
        return autograd.Variable(x).cuda()

    def np2var(self, x):
        return self.ts2var(torch.from_numpy(x))

    def transform(self, flag, batch_size=1):
        self.encoder.eval()
        source = self.test_source if flag == 'test' else self.train_source
        self.sample_type = 'all'
        data_loader = tordata.DataLoader(
            dataset=source,
            batch_size=batch_size,
            sampler=tordata.sampler.SequentialSampler(source),
            collate_fn=self.collate_fn,
            num_workers=self.num_workers)

        feature_list = list()
        view_list = list()
        seq_type_list = list()
        label_list = list()

        for i, x in enumerate(data_loader):
            seq, view, seq_type, label, batch_frame = x
            for j in range(len(seq)):
                seq[j] = self.np2var(seq[j]).float()
            if batch_frame is not None:
                batch_frame = self.np2var(batch_frame).int()
            # print(batch_frame, np.sum(batch_frame))

            feature, _ = self.encoder(*seq, batch_frame)
            n, num_bin, _ = feature.size()
            feature_list.append(feature.view(n, -1).data.cpu().numpy())
            view_list += view
            seq_type_list += seq_type
            label_list += label

        return np.concatenate(feature_list, 0), view_list, seq_type_list, label_list

    def save(self):
        os.makedirs(osp.join('checkpoint', self.model_name), exist_ok=True)
        torch.save(self.encoder.state_dict(),
                   osp.join('checkpoint', self.model_name,
                            '{}-{:0>5}-encoder.ptm'.format(
                                self.save_name, self.restore_iter)))
        torch.save(self.optimizer.state_dict(),
                   osp.join('checkpoint', self.model_name,
                            '{}-{:0>5}-optimizer.ptm'.format(
                                self.save_name, self.restore_iter)))

    # restore_iter: iteration index of the checkpoint to load
    def load(self, restore_iter):
        self.encoder.load_state_dict(torch.load(osp.join(
            'checkpoint', self.model_name,
            '{}-{:0>5}-encoder.ptm'.format(self.save_name, restore_iter))))
        self.optimizer.load_state_dict(torch.load(osp.join(
            'checkpoint', self.model_name,
            '{}-{:0>5}-optimizer.ptm'.format(self.save_name, restore_iter))))

示例#4

显示文件

print("loading model")
checkpoint = torch.load(args.model_path + '/' + args.model_name, map_location={'cuda:1': 'cuda:' + str(args.device_id[0]),
                                                                     'cuda:2': 'cuda:' + str(args.device_id[0]),
                                                                     'cuda:3': 'cuda:' + str(args.device_id[0]),
                                                                     'cuda:4': 'cuda:' + str(args.device_id[0]),
                                                                     'cuda:5': 'cuda:' + str(args.device_id[0]),
                                                                     'cuda:6': 'cuda:' + str(args.device_id[0]),
                                                                     'cuda:7': 'cuda:' + str(args.device_id[0]),
                                                                     'cuda:0': 'cuda:' + str(args.device_id[0])})
pre_train = checkpoint['model']
model_dict = model.state_dict()
for para in pre_train:
    if para in model_dict:
        model_dict[para] = pre_train[para]
model.load_state_dict(model_dict)
print('Finish Loading')
del checkpoint, pre_train, model_dict
print("Model: " + str(args.model_name))


predict_for_mAP = []
label_for_mAP = []

print("START")

UCF101Loader_test = torch.utils.data.DataLoader(
    UCF101_test.UCF101(video_path=args.video_path, frame_num=args.frame_num, img_size=224, anticipation=args.anticipation),
    batch_size=args.batch_size, shuffle=True, num_workers=0)

print(len(UCF101Loader_test))