test_csvae.py

import math
import sys
import os
from copy import deepcopy

from classifier.DenseNet import pretrained_classifier as celeba_classifier
from classifier.SimpleNet import pretrained_classifier as shapes_classifier
from data_loader.data_loader import ImageLabelLoader, ShapesLoader

from train_classifier import train as train_classif

from explainer.networks_128 import EncoderZ as EncoderZ_128
from explainer.networks_128 import EncoderW as EncoderW_128
from explainer.networks_128 import DecoderX as DecoderX_128
from explainer.networks_128 import DecoderY as DecoderY_128

from explainer.networks_64 import EncoderZ as EncoderZ_64
from explainer.networks_64 import EncoderW as EncoderW_64
from explainer.networks_64 import DecoderX as DecoderX_64
from explainer.networks_64 import DecoderY as DecoderY_64

import tensorflow.contrib.slim as slim
import tensorflow as tf
import numpy as np
from utils import read_data_file, save_batch_images, save_dict, save_config_dict
from losses import *
import pdb
import yaml
import warnings
import argparse

warnings.filterwarnings("ignore", category=DeprecationWarning)
np.random.seed(0)


def test(config, dbg_img_label_dict=None, dbg_mode=False, export_output=True, dbg_size=10, dbg_img_indices=[],
         calc_stability=True):

    # ============= Experiment Folder=============
    assets_dir = os.path.join(config['log_dir'], config['name'])
    log_dir = os.path.join(assets_dir, 'log')
    ckpt_dir = os.path.join(assets_dir, 'ckpt_dir')
    sample_dir = os.path.join(assets_dir, 'sample')

    # Whether this is for saving the results for substitutability metric or the regular testing process.
    # If only for substitutability, we skip saving large arrays and additional multiple random outputs to avoid OOM
    calc_substitutability = config['calc_substitutability']

    if calc_substitutability:
        substitutability_attr = config['substitutability_attr']

        test_dir = os.path.join(assets_dir, 'test', 'substitutability_input')
        substitutability_exported_img_label_dict = os.path.join(test_dir, '{}_dims_{}_clss_{}.txt'.format(
            substitutability_attr, config['w_dim'], config['num_bins']))
        substitutability_label_scaler = config['num_bins'] - 1
        exported_dict = {}

        substitutability_classifier_config = config['substitutability_classifier_config']
        _cls_config = yaml.load(open(config['classifier_config']))
        substitutability_img_subset = _cls_config['train']
        substitutability_img_label_dict = _cls_config['image_label_dict']
        _edited_cls_config = deepcopy(_cls_config)
        _edited_cls_config['image_dir'] = os.path.join(test_dir, 'images')
        if not os.path.exists(_edited_cls_config['image_dir']):
            os.makedirs(_edited_cls_config['image_dir'])
        _edited_cls_config['image_label_dict'] = substitutability_exported_img_label_dict
        _edited_cls_config['train'] = os.path.join(test_dir, 'train_ids.npy')
        _edited_cls_config['test'] = ''  # skips evaluating on test
        _edited_cls_config['log_dir'] = test_dir
        _edited_cls_config['ckpt_dir_continue'] = ''
        save_config_dict(_edited_cls_config, substitutability_classifier_config)
    else:
        test_dir = os.path.join(assets_dir, 'test')

    # ============= Experiment Parameters =============

    ckpt_dir_cls = config['cls_experiment']
    if 'evaluation_batch_size' in config.keys():
        BATCH_SIZE = config['evaluation_batch_size']
    else:
        BATCH_SIZE = config['batch_size']
    channels = config['num_channel']
    input_size = config['input_size']
    NUMS_CLASS_cls = config['num_class']
    NUMS_CLASS = config['num_bins']
    MU_CLUSTER = config['mu_cluster']
    VAR_CLUSTER = config['var_cluster']
    TRAVERSAL_N_SIGMA = config['traversal_n_sigma']
    STEP_SIZE = 2*TRAVERSAL_N_SIGMA * VAR_CLUSTER/(NUMS_CLASS - 1)
    OFFSET = MU_CLUSTER - TRAVERSAL_N_SIGMA * VAR_CLUSTER

    metrics_stability_nx = config['metrics_stability_nx']
    metrics_stability_var = config['metrics_stability_var']
    target_class = config['target_class']
    ckpt_dir_continue = ckpt_dir
    if dbg_img_label_dict is not None:
        image_label_dict = dbg_img_label_dict
    elif calc_substitutability:
        image_label_dict = substitutability_img_label_dict
    else:
        image_label_dict = config['image_label_dict']

    # CSVAE parameters
    beta1 = config['beta1']
    beta2 = config['beta2']
    beta3 = config['beta3']
    beta4 = config['beta4']
    beta5 = config['beta5']
    z_dim = config['z_dim']
    w_dim = config['w_dim']

    if dbg_mode:
        num_samples = dbg_size
    else:
        num_samples = config['count_to_save']

    dataset = config['dataset']

    if dataset == 'CelebA':
        my_data_loader = ImageLabelLoader(input_size=128)
        pretrained_classifier = celeba_classifier
        EncoderZ = EncoderZ_128
        EncoderW = EncoderW_128
        DecoderX = DecoderX_128
        DecoderY = DecoderY_128
    elif dataset == 'shapes':
        if calc_substitutability:
            my_data_loader = ShapesLoader()
        else:
            # my_data_loader = ShapesLoader()
            # for efficiency, let's just load as many samples as we need
            my_data_loader = ShapesLoader(dbg_mode=True, dbg_size=num_samples,
                                          dbg_image_label_dict=image_label_dict,
                                          dbg_img_indices=dbg_img_indices)
            dbg_mode = True
        pretrained_classifier = shapes_classifier
        EncoderZ = EncoderZ_64
        EncoderW = EncoderW_64
        DecoderX = DecoderX_64
        DecoderY = DecoderY_64
    elif dataset == 'CelebA64' or dataset == 'dermatology':
        my_data_loader = ImageLabelLoader(input_size=64)
        pretrained_classifier = celeba_classifier
        EncoderZ = EncoderZ_64
        EncoderW = EncoderW_64
        DecoderX = DecoderX_64
        DecoderY = DecoderY_64
    elif dataset == 'synthderm':
        my_data_loader = ImageLabelLoader(input_size=64)
        pretrained_classifier = celeba_classifier
        EncoderZ = EncoderZ_64
        EncoderW = EncoderW_64
        DecoderX = DecoderX_64
        DecoderY = DecoderY_64

    # ============= Data =============
    try:
        categories, file_names_dict = read_data_file(image_label_dict)
    except:
        print("Problem in reading input data file : ", image_label_dict)
        sys.exit()
    if calc_substitutability:
        data = np.load(substitutability_img_subset)
        num_samples = len(data)
    elif dbg_mode and dataset == 'shapes':
        data = np.array([str(ind) for ind in my_data_loader.tmp_list])
    else:
        if len(dbg_img_indices) > 0:
            data = np.asarray(dbg_img_indices)
        else:
            data = np.asarray(list(file_names_dict.keys()))
    print("The classification categories are: ")
    print(categories)
    print('The size of the test set: ', data.shape[0])

    # ============= placeholder =============
    x_source = tf.placeholder(tf.float32, [None, input_size, input_size, channels], name='x_source')
    y_s = tf.placeholder(tf.int32, [None, NUMS_CLASS_cls], name='y_s')
    y_source = y_s[:, NUMS_CLASS_cls - 1]
    train_phase = tf.placeholder(tf.bool, name='train_phase')

    y_target = tf.placeholder(tf.int32, [None, w_dim], name='y_target')  # between 0 and NUMS_CLASS

    generation_dim = w_dim

    # ============= CSVAE =============
    encoder_z = EncoderZ('encoder_z')
    encoder_w = EncoderW('encoder_w')
    decoder_x = DecoderX('decoder_x')
    decoder_y = DecoderY('decoder_y')

    # encode x to get mean, log variance, and samples from the latent subspace Z
    mu_z, logvar_z, z = encoder_z(x_source, z_dim)
    # encode x and y to get mean, log variance, and samples from the latent subspace W
    mu_w, logvar_w, w = encoder_w(x_source, y_source, w_dim)

    # pass samples of z and w to get predictions of x
    pred_x = decoder_x(tf.concat([w, z], axis=-1))
    # get predicted labels based only on the latent subspace Z
    pred_y = decoder_y(z, NUMS_CLASS_cls)

    # Create a single image based on y_target
    target_w = STEP_SIZE * tf.cast(y_target, dtype=tf.float32) + OFFSET
    fake_target_img = decoder_x(tf.concat([target_w, z], axis=-1))

    # ============= pre-trained classifier =============
    real_img_cls_logit_pretrained, real_img_cls_prediction = pretrained_classifier(x_source, NUMS_CLASS_cls,
                                                                                   reuse=False, name='classifier')
    fake_recon_cls_logit_pretrained, fake_recon_cls_prediction = pretrained_classifier(pred_x, NUMS_CLASS_cls,
                                                                                       reuse=True)
    fake_img_cls_logit_pretrained, fake_img_cls_prediction = pretrained_classifier(fake_target_img, NUMS_CLASS_cls,
                                                                                   reuse=True)

    # ============= predicted probabilities =============
    fake_target_p_tensor = tf.reduce_max(tf.cast(y_target, tf.float32) * 1.0 / float(NUMS_CLASS - 1), axis=1)

    # ============= session =============
    sess = tf.Session()
    sess.run(tf.global_variables_initializer())
    saver = tf.train.Saver()

    # ============= Checkpoints =============
    print(" [*] Reading checkpoint...")

    ckpt = tf.train.get_checkpoint_state(ckpt_dir_continue)
    if ckpt and ckpt.model_checkpoint_path:
        ckpt_name = os.path.basename(ckpt.model_checkpoint_path)
        saver.restore(sess, os.path.join(ckpt_dir_continue, ckpt_name))
        print(ckpt_dir_continue, ckpt_name)
        print("Successful checkpoint upload")
    else:
        print("Failed checkpoint load")
        sys.exit()

    # ============= load pre-trained classifier checkpoint =============
    class_vars = [var for var in slim.get_variables_to_restore() if 'classifier' in var.name]
    name_to_var_map_local = {var.op.name: var for var in class_vars}
    temp_saver = tf.train.Saver(var_list=name_to_var_map_local)
    ckpt = tf.train.get_checkpoint_state(ckpt_dir_cls)
    ckpt_name = os.path.basename(ckpt.model_checkpoint_path)
    temp_saver.restore(sess, os.path.join(ckpt_dir_cls, ckpt_name))
    print("Classifier checkpoint loaded.................")
    print(ckpt_dir_cls, ckpt_name)

    # ============= Testing =============
    def _save_output_array(name, values):
        np.save(os.path.join(test_dir, '{}.npy'.format(name)), values)

    if not calc_substitutability:
        names = np.empty([num_samples], dtype=object)
        real_imgs = np.empty([num_samples, input_size, input_size, channels])
        fake_t_imgs = np.empty([num_samples, generation_dim, NUMS_CLASS, input_size, input_size, channels])
        fake_s_recon_imgs = np.empty([num_samples, generation_dim, NUMS_CLASS, input_size, input_size, channels])
        real_ps = np.empty([num_samples, generation_dim, NUMS_CLASS, NUMS_CLASS_cls])
        recon_ps = np.empty([num_samples, generation_dim, NUMS_CLASS, NUMS_CLASS_cls])
        fake_target_ps = np.empty([num_samples, generation_dim, NUMS_CLASS])
        fake_ps = np.empty([num_samples, generation_dim, NUMS_CLASS, NUMS_CLASS_cls])

        # For stability metric
        stability_fake_t_imgs = np.empty([num_samples, metrics_stability_nx, generation_dim, NUMS_CLASS, input_size, input_size, channels])
        stability_fake_s_recon_imgs = np.empty([num_samples, metrics_stability_nx, generation_dim, NUMS_CLASS, input_size, input_size, channels])
        stability_recon_ps = np.empty([num_samples, metrics_stability_nx, generation_dim, NUMS_CLASS, NUMS_CLASS_cls])
        stability_fake_ps = np.empty([num_samples, metrics_stability_nx, generation_dim, NUMS_CLASS, NUMS_CLASS_cls])

        arrs_to_save = [
            'names', 'real_imgs', 'fake_t_imgs', 'fake_s_recon_imgs',
            'real_ps', 'recon_ps', 'fake_target_ps', 'fake_ps',
            'stability_fake_t_imgs', 'stability_fake_s_recon_imgs', 'stability_recon_ps', 'stability_fake_ps'
        ]

    np.random.shuffle(data)

    data = data[0:num_samples]
    for i in range(math.ceil(data.shape[0] / BATCH_SIZE)):
        image_paths = data[i * BATCH_SIZE:(i + 1) * BATCH_SIZE]
        # num_seed_imgs is either BATCH_SIZE
        # or if the number of samples is not divisible by BATCH_SIZE a smaller value
        num_seed_imgs = np.shape(image_paths)[0]
        img, _labels = my_data_loader.load_images_and_labels(image_paths, config['image_dir'], 1, file_names_dict,
                                                            channels, do_center_crop=True)
        img_repeat = np.repeat(img, NUMS_CLASS * generation_dim, 0)

        labels = np.repeat(_labels, NUMS_CLASS * generation_dim, 0)
        labels = labels.ravel()
        labels = np.eye(NUMS_CLASS_cls)[labels.astype(int)]

        _dim_bin_arr = np.zeros((generation_dim*NUMS_CLASS, generation_dim))
        for _gen_dim in range(generation_dim):
            _start = _gen_dim * NUMS_CLASS
            _end = (_gen_dim + 1) * NUMS_CLASS
            _dim_bin_arr_sub = np.zeros((NUMS_CLASS, generation_dim))
            _dim_bin_arr_sub[:, _gen_dim] = np.asarray(range(NUMS_CLASS))
            _dim_bin_arr[_start:_end, :] = _dim_bin_arr_sub
        target_labels = np.tile(_dim_bin_arr, (num_seed_imgs, 1))  # [num_seed_imgs * w_dim * NUMS_CLASS, w_dim]
        # target_labels = np.tile(
        #     np.repeat(np.expand_dims(np.asarray(range(NUMS_CLASS)), axis=1), generation_dim, axis=1),
        #     (num_seed_imgs*generation_dim, 1))  # [num_seed_imgs * w_dim * NUMS_CLASS, w_dim]

        my_feed_dict = {y_target: target_labels, x_source: img_repeat, train_phase: False,
                        y_s: labels}

        fake_t_img, fake_s_recon_img, real_p, recon_p, fake_target_p, fake_p = sess.run(
            [fake_target_img, pred_x,
             real_img_cls_prediction, fake_recon_cls_prediction, fake_target_p_tensor, fake_img_cls_prediction],
            feed_dict=my_feed_dict)

        print('{} / {}'.format(i + 1, math.ceil(data.shape[0] / BATCH_SIZE)))

        _num_cur_samples = len(image_paths)

        if calc_substitutability:
            _ind_generation_dim = np.random.randint(low=0, high=generation_dim, size=_num_cur_samples)
            reshaped_imgs = np.reshape(
                fake_t_img, (_num_cur_samples, generation_dim, NUMS_CLASS, input_size, input_size, channels))
            sub_exported_dict = save_batch_images(reshaped_imgs, image_paths, _ind_generation_dim,
                                                  _labels, substitutability_label_scaler,
                                                  _edited_cls_config['image_dir'], has_extension=(dataset != 'shapes'))
            exported_dict.update(sub_exported_dict)
        else:
            start_ind = i * BATCH_SIZE
            end_ind = start_ind + _num_cur_samples
            names[start_ind: end_ind] = np.asarray(image_paths)

            if calc_stability:
                for j in range(metrics_stability_nx):
                    noisy_img = img + np.random.normal(loc=0.0, scale=metrics_stability_var, size=np.shape(img))
                    stability_img_repeat = np.repeat(noisy_img, NUMS_CLASS * generation_dim, 0)
                    stability_feed_dict = {y_target: target_labels, x_source: stability_img_repeat, train_phase: False,
                                           y_s: labels}
                    _stability_fake_t_img, _stability_fake_s_recon_img, _stability_recon_p, _stability_fake_p = sess.run(
                        [fake_target_img, pred_x, fake_recon_cls_prediction, fake_img_cls_prediction],
                        feed_dict=stability_feed_dict)

                    stability_fake_t_imgs[start_ind: end_ind, j] = np.reshape(_stability_fake_t_img, (_num_cur_samples, generation_dim, NUMS_CLASS, input_size, input_size, channels))
                    stability_fake_s_recon_imgs[start_ind: end_ind, j] = np.reshape(_stability_fake_s_recon_img,  (_num_cur_samples, generation_dim, NUMS_CLASS, input_size, input_size, channels))
                    stability_recon_ps[start_ind: end_ind, j] = np.reshape(_stability_recon_p, (_num_cur_samples, generation_dim, NUMS_CLASS, NUMS_CLASS_cls))
                    stability_fake_ps[start_ind: end_ind, j] = np.reshape(_stability_fake_p, (_num_cur_samples, generation_dim, NUMS_CLASS, NUMS_CLASS_cls))

            real_imgs[start_ind: end_ind] = img
            fake_t_imgs[start_ind: end_ind] = np.reshape(fake_t_img, (_num_cur_samples, generation_dim, NUMS_CLASS, input_size, input_size, channels))
            fake_s_recon_imgs[start_ind: end_ind] = np.reshape(fake_s_recon_img, (_num_cur_samples, generation_dim, NUMS_CLASS, input_size, input_size, channels))
            real_ps[start_ind: end_ind] = np.reshape(real_p, (_num_cur_samples, generation_dim, NUMS_CLASS, NUMS_CLASS_cls))
            recon_ps[start_ind: end_ind] = np.reshape(recon_p, (_num_cur_samples, generation_dim, NUMS_CLASS, NUMS_CLASS_cls))
            fake_target_ps[start_ind: end_ind] = np.reshape(fake_target_p, (_num_cur_samples, generation_dim, NUMS_CLASS))
            fake_ps[start_ind: end_ind] = np.reshape(fake_p, (_num_cur_samples, generation_dim, NUMS_CLASS, NUMS_CLASS_cls))

    output_dict = {}
    if calc_substitutability:
        save_dict(exported_dict, substitutability_exported_img_label_dict, substitutability_attr)
        np.save(_edited_cls_config['train'], np.asarray(list(exported_dict.keys())))

        # retrain the classifier with the new generated images
        tf.reset_default_graph()
        train_classif(config['substitutability_classifier_config'])
    else:
        if export_output:
            for arr_name in arrs_to_save:
                _save_output_array(arr_name, eval(arr_name))

        for arr_name in arrs_to_save:
            output_dict.update({arr_name: eval(arr_name)})

    return output_dict


if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument('--config', '-c', type=str)
    parser.add_argument('--skip_test', '-skip', action='store_true')
    parser.add_argument('--substitutability', '-s', action='store_true')
    args = parser.parse_args()

    # ============= Load config =============

    config = yaml.load(open(args.config))
    print(config)

    if not args.skip_test:
        test(config)

    if args.substitutability:
        config['calc_substitutability'] = True
        print('Saving generated images to be used for substitutability metric')
        test(config)