Python DataHelper.fill_missing_data примеры использования

Язык программирования: Python

Пространство имен/Пакет: data_helper

Класс/Тип: DataHelper

Метод/Функция: fill_missing_data

Примеров на hotexamples.com: 2

Python DataHelper.fill_missing_data - 2 примера найдено. Это лучшие примеры Python кода для data_helper.DataHelper.fill_missing_data, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

DataHelper(30)

batch_iter(7)

create_data_helper(4)

do_random_augment(4)

extract_feature_labels(3)

adapt_rate(3)

fill_missing_data(2)

create_masked_generator_full_path(2)

create_generator_full_path_with_spm(2)

gen_training_batch(2)

add_nan_indication_cols(2)

calculate_augmentation_rate(2)

columns_to_drop_from_columns_to_keep(1)

create_test_gen(1)

gen_train_batches(1)

gen_train_batch(1)

gen_test_samples(1)

from_files(1)

batch_generator(1)

build(1)

data(1)

crop_resize_aug_img(1)

crop_image_bbox(1)

create_spatial_mask_path(1)

create_synthesized_landmarks_path(1)

create_AU_mask(1)

create_spatial_mask(1)

create_label_mapping(1)

create_input_bunches(1)

calculate_max_nb_features(1)

create_generators(1)

calculate_metrics(1)

create_derivative_path(1)

create_derivative(1)

categorize_valence(1)

create_AU_mask_path(1)

create_generators_with_mask(1)

Пример #1

Показать файл

###############################################################################

from io_helper import IOHelper
from statistics_helper import StatisticsHelper
from data_helper import DataHelper
from config_helper import ConfigHelper

if __name__ == "__main__":

    dataset_name = ConfigHelper.analysis_dataset

    train_data = IOHelper.read_dataset(dataset_name)
    for col in train_data.columns:
        series = train_data[col]

        stats = StatisticsHelper.get_feature_stats(series)
        StatisticsHelper.draw_feature_distribution(series, col)
        IOHelper.store_analysis(stats, col, dataset_name)

    DataHelper.fill_missing_data(train_data, is_train=True)
    for col in train_data.columns:
        series = train_data[col]

        col = col + "_filled"
        stats = StatisticsHelper.get_feature_stats(series)
        StatisticsHelper.draw_feature_distribution(series, col)
        IOHelper.store_analysis(stats, col, dataset_name)

Пример #2

Показать файл

Файл: generate_test_submission.py Проект: jpedrocm/porto-seguro-experiment

from config_helper import ConfigHelper
from metrics_helper import MetricsHelper

if __name__ == "__main__":

    train_data = IOHelper.read_dataset("train")
    train_X, train_y = DataHelper.extract_feature_labels(train_data)

    predef = ConfigHelper.use_predefined_cols

    DataHelper.add_nan_indication_cols(train_X)
    DataHelper.remove_high_nan_rate_cols(train_X, predef)
    DataHelper.remove_small_variance_cols(train_X, predef)

    train_y = DataHelper.remove_high_nan_rate_rows(train_X, train_y)
    DataHelper.fill_missing_data(train_X, is_train=True)
    train_X = DataHelper.split_categorical_cols(train_X, is_train=True)
    DataHelper.scale_continuous_cols(train_X, is_train=True)
    train_X = DataHelper.select_best_features(train_X,
                                              None,
                                              train_y,
                                              ConfigHelper.max_nb_features,
                                              is_train=True)

    test_X = IOHelper.read_dataset("test")

    DataHelper.add_nan_indication_cols(test_X)
    DataHelper.remove_high_nan_rate_cols(test_X, True)
    DataHelper.remove_small_variance_cols(test_X, True)

    DataHelper.fill_missing_data(test_X, is_train=False)