Esempi in Python per evalaute_running_mdl_data_set, esempi in Python per new_training_algorithms.evalaute_running_mdl_data_set

Esempio n. 1

0

Mostra file

def print_evaluation_of_nets(net_nl,
                             net_rlnl,
                             criterion,
                             error_criterion,
                             trainloader,
                             testloader,
                             device,
                             iterations=inf,
                             l=2):
    W_nl = get_norm(net_nl, l=l)
    W_rlnl = get_norm(net_rlnl, l=l)
    print('')
    print(f'W_nl = {W_nl}')
    print(f'W_rlnl = {W_rlnl}')
    ''' train errors '''
    loss_nl_train, error_nl_train = evalaute_running_mdl_data_set(
        criterion, error_criterion, net_nl, trainloader, device, iterations)
    loss_rlnl_train, error_rlnl_train = evalaute_running_mdl_data_set(
        criterion, error_criterion, net_rlnl, trainloader, device, iterations)
    print(f'loss_nl_train, error_nl_train = {loss_nl_train, error_nl_train}')
    print(
        f'loss_rlnl_train, error_rlnl_train = {loss_rlnl_train, error_rlnl_train}'
    )
    ''' test errors '''
    loss_nl_test, error_nl_test = evalaute_running_mdl_data_set(
        criterion, error_criterion, net_nl, testloader, device, iterations)
    loss_rlnl_test, error_rlnl_test = evalaute_running_mdl_data_set(
        criterion, error_criterion, net_rlnl, testloader, device, iterations)
    print(f'loss_nl_test, error_nl_test = {loss_nl_test, error_nl_test}')
    print(
        f'loss_rlnl_test, error_rlnl_test = {loss_rlnl_test, error_rlnl_test}')

Esempio n. 2

0

Mostra file

def get_landscapes_stats_between_nets(net1, net2, interpolations, device,
                                      stats_collector, criterion,
                                      error_criterion, trainloader, testloader,
                                      iterations):
    '''
        Records the errors for the path by convexly averaging two nets. The goal
        is to be able to estimate the size of the wall between the two different minimums.
    '''
    ''' '''
    interpolated_net = copy.deepcopy(net1)
    diff_W1_W2 = weight_diff_btw_nets(net1, net2)
    for i, alpha in enumerate(interpolations):
        print(f'i={i}, alpha={alpha}')
        ''' interpolate nets with current alpha '''
        interpolated_net = convex_interpolate_nets(interpolated_net, net1,
                                                   net2, alpha)
        ''' evalaute model '''
        train_loss, train_error = evalaute_running_mdl_data_set(
            criterion, error_criterion, interpolated_net, trainloader, device,
            iterations)
        test_loss, test_error = evalaute_running_mdl_data_set(
            criterion, error_criterion, interpolated_net, testloader, device,
            iterations)
        ''' record result '''
        stats_collector.append_losses_errors_accs(train_loss, train_error,
                                                  test_loss, test_error)
        stats_collector.collect_mdl_params_stats(interpolated_net)
        ''' record distance '''
        r = alpha * diff_W1_W2
        stats_collector.rs.append(r)
    return train_loss, train_error, test_loss, test_error, interpolations  #note this is just some random trial

Esempio n. 3

0

Mostra file

def get_radius_errors_loss_list_via_interpolation(dir_index, net, r_large,
                                                  interpolations, device,
                                                  stats_collector, criterion,
                                                  error_criterion, trainloader,
                                                  testloader, iterations):
    '''
        Computes I = [..., I(W+r*dx),...]. A sequence of errors/losses
        from a starting minimum W to the final minum net r*dx.
        The goal of this is for the easy of computation of the epsilon radius of
        a network which is defined as follows:
            r(dx,eps,W) = sup{r \in R : |I(W) - I(W+r*dx)|<=eps}
        W_all = r*dx
        dx = isotropic unit vector from the net
    '''
    ''' record reference errors/losses '''
    stats_collector.record_errors_loss_reference_net(criterion,
                                                     error_criterion, net,
                                                     trainloader, testloader,
                                                     device)
    ''' get isotropic direction '''
    nb_params = nn_mdls.count_nb_params(net)
    v = torch.normal(torch.zeros(nb_params), torch.ones(nb_params)).to(device)
    dx = v / v.norm(2)
    ''' fill up I list '''
    net_r = copy.deepcopy(net)
    net_end = produce_new_translated_net(net, r_large, dx)
    #print(f'||net1 - net2|| = {weight_diff_btw_nets(net_end,net)}')
    for epoch, alpha in enumerate(interpolations):
        ''' compute I(W+r*dx) = I(W+W_all)'''
        net_r = convex_interpolate_nets(
            net_r, net1=net_end, net2=net,
            alpha=alpha)  # alpha*net_end+(1-alpha)*net
        Er_train_loss, Er_train_error = evalaute_running_mdl_data_set(
            criterion, error_criterion, net_r, trainloader, device, iterations)
        Er_test_loss, Er_test_error = evalaute_running_mdl_data_set(
            criterion, error_criterion, net_r, testloader, device, iterations)
        ''' record result '''
        stats_collector.append_losses_errors_accs(Er_train_loss,
                                                  Er_train_error, Er_test_loss,
                                                  Er_test_error)
        errors_losses = [
            Er_train_loss, Er_train_error, Er_test_loss, Er_test_error
        ]
        stats_collector.append_all_losses_errors_accs(dir_index, epoch,
                                                      errors_losses)
        ''' record current r '''
        r = alpha * r_large
        stats_collector.rs.append(r)
    #stats_collector.random_dirs.append(dx.cpu().numpy())
    return Er_train_loss, Er_train_error, Er_test_loss, Er_test_error, net_r

Esempio n. 4

0

Mostra file

 def get_random_faltness_radius_repeated_doubling(self, precision=0.0001):
     '''
         The goal of this is for the easy of computation of the epsilon radius of
         a network which is defined as follows:
             r(dx,eps,W) = sup{r \in R : |I(W) - I(W+r*dx)|<=eps}
         W_all = r*dx
         dx = isotropic unit vector from the net
     '''
     ''' record reference errors/losses '''
     #stats_collector.record_errors_loss_reference_net(criterion,error_criterion,net,trainloader,testloader,device)
     ''' get isotropic direction '''
     nb_params = nn_mdls.count_nb_params(self.net)
     v = torch.normal(torch.zeros(nb_params),
                      torch.ones(nb_params)).to(self.device)
     dx = v / v.norm(2)
     ''' fill up I list '''
     r = self.r_initial
     Loss_minima, Error_minima = evalaute_running_mdl_data_set(
         self.criterion, self.error_criterion, self.net, self.trainloader,
         self.device, self.iterations)
     while True:
         net_rdx = produce_new_translated_net(self.net, r, dx)
         Loss_rdx, Error_rdx = evalaute_running_mdl_data_set(
             self.criterion, self.error_criterion, net_rdx,
             self.trainloader, self.device, self.iterations)
         diff = Error_rdx - Error_minima
         print(f'\n--\nr = {r}')
         print(f'Error_minima={Error_minima}')
         print(f'Error_rdx={Error_rdx}')
         print(f'diff = {diff}')
         print(f'epsilon={self.epsilon}')
         print(f'abs(abs(diff)-eps)={abs(abs(diff)-self.epsilon)}')
         print(f'precision={precision}')
         print(
             f'abs(abs(diff)-eps) < precision={abs(abs(diff)-self.epsilon) < precision}'
         )
         print(
             f'approx_equals(diff,self.epsilon,precision=precision)={approx_equals(diff,self.epsilon,precision=precision)}'
         )
         ''' check if we reached epsilon jump '''
         if approx_equals(diff, self.epsilon, precision=precision
                          ):  ## 10^-4.5 for half machine precision
             ''' compute I(W+r*dx) = I(W+W_all)'''
             st()
             return r
         elif diff > self.epsilon:  # I(w+rdx) - I(W) > eps, r is too large
             r /= 2
         else:  # I(w+rdx) - I(W) < eps, r is too small
             r *= 1.5

Esempio n. 5

0

Mostra file

    def get_random_faltness_radius_upper_lower_bs(self, precision=0.0001):
        '''
            The goal of this is for the easy of computation of the epsilon radius of
            a network which is defined as follows:
                r(dx,eps,W) = sup{r \in R : |I(W) - I(W+r*dx)|<=eps}
            W_all = r*dx
            dx = isotropic unit vector from the net
        '''
        ''' record reference errors/losses '''
        #stats_collector.record_errors_loss_reference_net(criterion,error_criterion,net,trainloader,testloader,device)
        ''' get isotropic direction '''
        nb_params = nn_mdls.count_nb_params(self.net)
        v = torch.normal(torch.zeros(nb_params),
                         torch.ones(nb_params)).to(self.device)
        dx = v / v.norm(2)
        ''' set up '''
        lb, ub = 0, 2 * self.r_initial
        _, error_minima = evalaute_running_mdl_data_set(
            self.criterion, self.error_criterion, self.net, self.trainloader,
            self.device, self.iterations)
        y_target = error_minima + self.epsilon  # I(W) + eps = I(W+0*dx) + eps

        def f(r):
            net_rdx = produce_new_translated_net(self.net, r, dx)
            Loss_rdx, Error_rdx = evalaute_running_mdl_data_set(
                self.criterion, self.error_criterion, net_rdx,
                self.trainloader, self.device, self.iterations)
            return Error_rdx - y_target

        ''' start bisect method '''  # https://en.wikipedia.org/wiki/Bisection_method
        f_lb = error_minima - y_target
        #f_ub = f(ub)
        while True:
            r = (lb + ub) / 2
            f_r = f(r)  # note this value could be negative
            # print('--')
            # print(f'lb={lb}')
            # print(f'ub={ub}')
            # print(f'r = {r}')
            # print(f'f(r) = f({r}) = {f_r}')
            # print(f'f(lb) = f({lb}) = {f_lb}')
            # print(f'abs(f_r - 0) < precision = {abs(f_r - 0) < precision}')
            # print(f'abs(ub - lb) < precision = {abs(ub - lb) < precision}')
            ''' check if we reached epsilon jump '''
            if abs(f_r - 0) < precision or abs(
                    ub -
                    lb) < precision:  ## 10^-4.5 for half machine precision
                ''' compute I(W+r*dx) = I(W+W_all)'''
                return r
            elif np.sign(f_r) == np.sign(f_lb):
                lb = r
                f_lb = f_r
            else:
                ub = r

Esempio n. 6

0

Mostra file

def get_radius_errors_loss_list(dir_index, net, r_large, rs, device,
                                stats_collector, criterion, error_criterion,
                                trainloader, testloader, iterations):
    '''
        Computes I = [..., I(W+r*dx),...]. A sequence of errors/losses
        from a starting minimum W to the final minum net r*dx.
        The goal of this is for the easy of computation of the epsilon radius of
        a network which is defined as follows:
            r(dx,eps,W) = sup{r \in R : |I(W) - I(W+r*dx)|<=eps}
        W_all = r*dx
        dx = isotropic unit vector from the net
    '''
    ''' record reference errors/losses '''
    stats_collector.record_errors_loss_reference_net(criterion,
                                                     error_criterion, net,
                                                     trainloader, testloader,
                                                     device)
    ''' get isotropic direction '''
    nb_params = nn_mdls.count_nb_params(net)
    #mvg_sampler = torch.distributions.multivariate_normal.MultivariateNormal(torch.zeros(nb_params), torch.eye(nb_params))
    v = torch.normal(torch.zeros(nb_params), torch.ones(nb_params)).to(device)
    dx = v / v.norm(2)
    ''' fill up I list '''
    net_r = copy.deepcopy(net)
    for epoch, r in enumerate(rs):
        ''' compute I(W+r*dx) = I(W+W_all)'''
        net_r = translate_net_by_rdx(net, net_r, r, dx)
        Er_train_loss, Er_train_error = evalaute_running_mdl_data_set(
            criterion, error_criterion, net_r, trainloader, device)
        Er_test_loss, Er_test_error = evalaute_running_mdl_data_set(
            criterion, error_criterion, net_r, testloader, device)
        ''' record result '''
        stats_collector.append_losses_errors_accs(Er_train_loss,
                                                  Er_train_error, Er_test_loss,
                                                  Er_test_error)
        errors_losses = [
            Er_train_loss, Er_train_error, Er_test_loss, Er_test_error
        ]
        stats_collector.append_all_losses_errors_accs(dir_index, epoch,
                                                      errors_losses)
    return Er_train_loss, Er_train_error, Er_test_loss, Er_test_error, net_r

Esempio n. 7

0

Mostra file

 def f(r):
     net_rdx = produce_new_translated_net(self.net, r, dx)
     Loss_rdx, Error_rdx = evalaute_running_mdl_data_set(
         self.criterion, self.error_criterion, net_rdx,
         self.trainloader, self.device, self.iterations)
     return Error_rdx - y_target