Python CycleGAN.loadfromDir Examples

Programming Language: Python

Namespace/Package Name: model

Class/Type: CycleGAN

Method/Function: loadfromDir

Examples at hotexamples.com: 2

Python CycleGAN.loadfromDir - 2 examples found. These are the top rated real world Python examples of model.CycleGAN.loadfromDir extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

CycleGAN(30)

model(16)

optimize(9)

load(9)

save(5)

build(3)

load_state_dict(2)

cuda(2)

parameters(2)

loadfromDir(2)

setup(1)

set_requires_grad(1)

save_networks(1)

sample(1)

run(1)

optimize2(1)

loadEpoch(1)

load_networks(1)

load_checkpoint(1)

backward_D(1)

learning_rate_decay_op(1)

get_current_losses(1)

get_current_images(1)

get_curent_learning_rate(1)

generator(1)

generate(1)

forward(1)

discriminator(1)

compile(1)

backward_G(1)

summary(1)

Example #1

Show file

def train(train_A_dir, train_B_dir, model_dir, model_name, random_seed,
          validation_A_dir, validation_B_dir, output_dir, tensorboard_log_dir):

    np.random.seed(random_seed)

    num_epochs = 1501
    mini_batch_size = 1  # mini_batch_size = 1 is better
    generator_learning_rate = 0.0002
    generator_learning_rate_decay = generator_learning_rate / 200000
    discriminator_learning_rate = 0.0001
    discriminator_learning_rate_decay = discriminator_learning_rate / 200000
    sampling_rate = 16000
    num_mcep = 24
    frame_period = 5.0
    n_frames = 128
    lambda_cycle = 10
    lambda_identity = 5

    print('Preprocessing Data...')

    start_time = time.time()

    wavs_A = load_wavs(wav_dir=train_A_dir, sr=sampling_rate)
    wavs_B = load_wavs(wav_dir=train_B_dir, sr=sampling_rate)

    f0s_A, timeaxes_A, sps_A, aps_A, coded_sps_A = world_encode_data(wavs = wavs_A, fs = sampling_rate,\
                                                                     frame_period = frame_period, coded_dim = num_mcep)
    f0s_B, timeaxes_B, sps_B, aps_B, coded_sps_B = world_encode_data(wavs = wavs_B, fs = sampling_rate,\
                                                                     frame_period = frame_period, coded_dim = num_mcep)

    log_f0s_mean_A, log_f0s_std_A = logf0_statistics(f0s_A)
    log_f0s_mean_B, log_f0s_std_B = logf0_statistics(f0s_B)

    print('Log Pitch A')
    print('Mean: %f, Std: %f' % (log_f0s_mean_A, log_f0s_std_A))
    print('Log Pitch B')
    print('Mean: %f, Std: %f' % (log_f0s_mean_B, log_f0s_std_B))

    coded_sps_A_transposed = transpose_in_list(lst=coded_sps_A)
    coded_sps_B_transposed = transpose_in_list(lst=coded_sps_B)

    coded_sps_A_norm, coded_sps_A_mean, coded_sps_A_std\
    = coded_sps_normalization_fit_transoform(coded_sps = coded_sps_A_transposed)
    coded_sps_B_norm, coded_sps_B_mean, coded_sps_B_std\
    = coded_sps_normalization_fit_transoform(coded_sps = coded_sps_B_transposed)

    print("Input data fixed.")

    if not os.path.exists(model_dir):
        os.makedirs(model_dir)
    np.savez(os.path.join(model_dir, 'logf0s_normalization.npz'),\
             mean_A = log_f0s_mean_A, std_A = log_f0s_std_A, mean_B = log_f0s_mean_B, std_B = log_f0s_std_B)
    np.savez(os.path.join(model_dir, 'mcep_normalization.npz'), \
             mean_A = coded_sps_A_mean, std_A = coded_sps_A_std, mean_B = coded_sps_B_mean, std_B = coded_sps_B_std)

    if validation_A_dir is not None:
        validation_A_output_dir = os.path.join(output_dir, 'converted_A')
        #if not os.path.exists(validation_A_output_dir):
        #    os.makedirs(validation_A_output_dir)

    if validation_B_dir is not None:
        validation_B_output_dir = os.path.join(output_dir, 'converted_B')
        #if not os.path.exists(validation_B_output_dir):
        #    os.makedirs(validation_B_output_dir)

    end_time = time.time()
    time_elapsed = end_time - start_time

    print('Preprocessing Done.')

    print('Time Elapsed for Data Preprocessing: %02d:%02d:%02d' % \
          (time_elapsed // 3600, (time_elapsed % 3600 // 60), (time_elapsed % 60 // 1))\
         )

    loadEpoch = 0

    model = CycleGAN(num_features=num_mcep)

    if os.path.exists(model_dir):
        loadEpoch = model.loadEpoch(model_dir)
    print('Load Epoch:', loadEpoch)
    if loadEpoch > 0:
        loadEpoch += 1
        model.loadfromDir(model_dir)

    for epoch in range(loadEpoch, num_epochs):
        print('Epoch: %d' % epoch)

        if epoch > 60:
            lambda_identity = 0
        if epoch > 1250:
            generator_learning_rate = max(0,
                                          generator_learning_rate - 0.0000002)
            discriminator_learning_rate = max(
                0, discriminator_learning_rate - 0.0000001)

        start_time_epoch = time.time()

        dataset_A, dataset_B = sample_train_data(dataset_A = coded_sps_A_norm, \
                                                 dataset_B = coded_sps_B_norm, \
                                                 n_frames = n_frames)

        n_samples = dataset_A.shape[0]

        for i in range(n_samples // mini_batch_size):

            num_iterations = n_samples // mini_batch_size * epoch + i

            if num_iterations > 10000:
                lambda_identity = 0
            if num_iterations > 200000:
                generator_learning_rate = max(
                    0, generator_learning_rate - generator_learning_rate_decay)
                discriminator_learning_rate = max(
                    0, discriminator_learning_rate -
                    discriminator_learning_rate_decay)

            start = i * mini_batch_size
            end = (i + 1) * mini_batch_size

            generator_loss, discriminator_loss = model.train(input_A = dataset_A[start:end],\
                                                             input_B = dataset_B[start:end],\
                                                             lambda_cycle = lambda_cycle,\
                                                             lambda_identity = lambda_identity,\
                                                             generator_learning_rate = generator_learning_rate,\
                                                             discriminator_learning_rate = discriminator_learning_rate\
                                                            )

            if i % 50 == 0:
                print('Iteration: %d, Generator Loss : %f, Discriminator Loss : %f' % \
                      (num_iterations, generator_loss, discriminator_loss)\
                     )
                #print('Iteration: {:07d}, Generator Learning Rate: {:.7f}, Discriminator Learning Rate: {:.7f},
                #Generator Loss : {:.3f}, Discriminator Loss : {:.3f}'.format(
                #num_iterations, generator_learning_rate, discriminator_learning_rate, generator_loss, discriminator_loss))

        end_time_epoch = time.time()
        time_elapsed_epoch = end_time_epoch - start_time_epoch

        print('Time Elapsed for This Epoch: %02d:%02d:%02d' % (time_elapsed_epoch // 3600,\
                                                               (time_elapsed_epoch % 3600 // 60),\
                                                               (time_elapsed_epoch % 60 // 1))\
             )

        if validation_A_dir is not None:
            if epoch % 50 == 0:
                print('Generating Validation Data B from A...')
                for file in os.listdir(validation_A_dir)[:10]:
                    filepath = os.path.join(validation_A_dir, file)
                    wav, _ = librosa.load(filepath,
                                          sr=sampling_rate,
                                          mono=True)
                    wav = wav_padding(wav=wav,
                                      sr=sampling_rate,
                                      frame_period=frame_period,
                                      multiple=4)
                    f0, timeaxis, sp, ap = world_decompose(
                        wav=wav, fs=sampling_rate, frame_period=frame_period)
                    f0_converted = pitch_conversion(f0 = f0, mean_log_src = log_f0s_mean_A, std_log_src = log_f0s_std_A,\
                                                    mean_log_target = log_f0s_mean_B, std_log_target = log_f0s_std_B)
                    coded_sp = world_encode_spectral_envelop(sp=sp,
                                                             fs=sampling_rate,
                                                             dim=num_mcep)
                    coded_sp_transposed = coded_sp.T
                    coded_sp_norm = (coded_sp_transposed -
                                     coded_sps_A_mean) / coded_sps_A_std
                    coded_sp_converted_norm = model.test(inputs=np.array(
                        [coded_sp_norm]),
                                                         direction='A2B')[0]
                    coded_sp_converted = coded_sp_converted_norm * coded_sps_B_std + coded_sps_B_mean
                    coded_sp_converted = coded_sp_converted.T
                    coded_sp_converted = np.ascontiguousarray(
                        coded_sp_converted)
                    decoded_sp_converted = world_decode_spectral_envelop(
                        coded_sp=coded_sp_converted, fs=sampling_rate)
                    wav_transformed = world_speech_synthesis(f0 = f0_converted, decoded_sp = decoded_sp_converted, ap = ap,\
                                                             fs = sampling_rate, frame_period = frame_period)
                    if not os.path.exists(validation_A_output_dir +
                                          "_{}epc".format(epoch)):
                        os.makedirs(validation_A_output_dir +
                                    "_{}epc".format(epoch))
                    librosa.output.write_wav(os.path.join(validation_A_output_dir+"_{}epc".format(epoch),\
                                                          os.path.basename(file)\
                                                         ),\
                                             wav_transformed,\
                                             sampling_rate)

        if validation_B_dir is not None:
            if epoch % 50 == 0:
                print('Generating Validation Data A from B...')
                for file in os.listdir(validation_B_dir):
                    filepath = os.path.join(validation_B_dir, file)
                    wav, _ = librosa.load(filepath,
                                          sr=sampling_rate,
                                          mono=True)
                    wav = wav_padding(wav=wav,
                                      sr=sampling_rate,
                                      frame_period=frame_period,
                                      multiple=4)
                    f0, timeaxis, sp, ap = world_decompose(
                        wav=wav, fs=sampling_rate, frame_period=frame_period)
                    f0_converted = pitch_conversion(f0 = f0, mean_log_src = log_f0s_mean_B, std_log_src = log_f0s_std_B,\
                                                    mean_log_target = log_f0s_mean_A, std_log_target = log_f0s_std_A)
                    coded_sp = world_encode_spectral_envelop(sp=sp,
                                                             fs=sampling_rate,
                                                             dim=num_mcep)
                    coded_sp_transposed = coded_sp.T
                    coded_sp_norm = (coded_sp_transposed -
                                     coded_sps_B_mean) / coded_sps_B_std
                    coded_sp_converted_norm = model.test(inputs=np.array(
                        [coded_sp_norm]),
                                                         direction='B2A')[0]
                    coded_sp_converted = coded_sp_converted_norm * coded_sps_A_std + coded_sps_A_mean
                    coded_sp_converted = coded_sp_converted.T
                    coded_sp_converted = np.ascontiguousarray(
                        coded_sp_converted)
                    decoded_sp_converted = world_decode_spectral_envelop(
                        coded_sp=coded_sp_converted, fs=sampling_rate)
                    wav_transformed = world_speech_synthesis(f0 = f0_converted, decoded_sp = decoded_sp_converted, ap = ap,\
                                                             fs = sampling_rate, frame_period = frame_period)
                    if not os.path.exists(validation_B_output_dir +
                                          "_{}epc".format(epoch)):
                        os.makedirs(validation_B_output_dir +
                                    "_{}epc".format(epoch))
                    librosa.output.write_wav(os.path.join(validation_B_output_dir+"_{}epc".format(epoch),\
                                                          os.path.basename(file)), wav_transformed, sampling_rate)

        if epoch % 100 == 0:
            #if not os.path.exists( model_dir+"_{}epc".format(epoch) ):
            #    os.makedirs( model_dir+"_{}epc".format(epoch) )
            model.save(directory=model_dir, filename=model_name, epoch=epoch)

Example #2

Show file

File: convert.py Project: ChangNamAn/Fake-Voice-Detection

def conversion(model_dir, model_name, data_dir, conversion_direction,
               output_dir):

    num_features = 24
    sampling_rate = 16000
    frame_period = 5.0

    model = CycleGAN(num_features=num_features, mode='test')

    #model.load(filepath = os.path.join(model_dir, model_name+'.ckpt'))
    model.loadfromDir(model_dir)

    mcep_normalization_params = np.load(
        os.path.join(model_dir, 'mcep_normalization.npz'))
    mcep_mean_A = mcep_normalization_params['mean_A']
    mcep_std_A = mcep_normalization_params['std_A']
    mcep_mean_B = mcep_normalization_params['mean_B']
    mcep_std_B = mcep_normalization_params['std_B']

    logf0s_normalization_params = np.load(
        os.path.join(model_dir, 'logf0s_normalization.npz'))
    logf0s_mean_A = logf0s_normalization_params['mean_A']
    logf0s_std_A = logf0s_normalization_params['std_A']
    logf0s_mean_B = logf0s_normalization_params['mean_B']
    logf0s_std_B = logf0s_normalization_params['std_B']

    if not os.path.exists(output_dir):
        os.makedirs(output_dir)

    for file in os.listdir(data_dir):

        filepath = os.path.join(data_dir, file)
        wav, _ = librosa.load(filepath, sr=sampling_rate, mono=True)
        wav = wav_padding(wav=wav,
                          sr=sampling_rate,
                          frame_period=frame_period,
                          multiple=4)
        f0, timeaxis, sp, ap = world_decompose(wav=wav,
                                               fs=sampling_rate,
                                               frame_period=frame_period)
        coded_sp = world_encode_spectral_envelop(sp=sp,
                                                 fs=sampling_rate,
                                                 dim=num_features)
        coded_sp_transposed = coded_sp.T

        if conversion_direction == 'A2B':
            f0_converted = pitch_conversion(f0=f0,
                                            mean_log_src=logf0s_mean_A,
                                            std_log_src=logf0s_std_A,
                                            mean_log_target=logf0s_mean_B,
                                            std_log_target=logf0s_std_B)
            #f0_converted = f0
            coded_sp_norm = (coded_sp_transposed - mcep_mean_A) / mcep_std_A
            coded_sp_converted_norm = model.test(
                inputs=np.array([coded_sp_norm]),
                direction=conversion_direction)[0]
            coded_sp_converted = coded_sp_converted_norm * mcep_std_B + mcep_mean_B
        else:
            f0_converted = pitch_conversion(f0=f0,
                                            mean_log_src=logf0s_mean_B,
                                            std_log_src=logf0s_std_B,
                                            mean_log_target=logf0s_mean_A,
                                            std_log_target=logf0s_std_A)
            #f0_converted = f0
            coded_sp_norm = (coded_sp_transposed - mcep_mean_B) / mcep_std_B
            coded_sp_converted_norm = model.test(
                inputs=np.array([coded_sp_norm]),
                direction=conversion_direction)[0]
            coded_sp_converted = coded_sp_converted_norm * mcep_std_A + mcep_mean_A

        coded_sp_converted = coded_sp_converted.T
        coded_sp_converted = np.ascontiguousarray(coded_sp_converted)
        decoded_sp_converted = world_decode_spectral_envelop(
            coded_sp=coded_sp_converted, fs=sampling_rate)
        wav_transformed = world_speech_synthesis(
            f0=f0_converted,
            decoded_sp=decoded_sp_converted,
            ap=ap,
            fs=sampling_rate,
            frame_period=frame_period)
        librosa.output.write_wav(
            os.path.join(output_dir, os.path.basename(file)), wav_transformed,
            sampling_rate)