Ejemplos de Clean.replace_missing_new_category en Python

Lenguaje de programación: Python

Namespace/Package Name: pyautoml

Clase / Tipo: Clean

Método / Función: replace_missing_new_category

Ejemplos en hotexamples.com: 5

Python Clean.replace_missing_new_category - 5 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de pyautoml.Clean.replace_missing_new_category extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Clean(24)

replace_missing_new_category(5)

drop(2)

remove_columns(2)

to_csv(1)

target_mapping(1)

search(1)

replace_missing_remove_row(1)

replace_missing_random_discrete(1)

replace_missing_mostcommon(1)

replace_missing_median(1)

replace_missing_mean(1)

replace_missing_interpolate(1)

replace_missing_knn(1)

replace_missing_indicator(1)

replace_missing_forwardfill(1)

replace_missing_constant(1)

replace_missing_backfill(1)

remove_rows(1)

remove_duplicate_rows(1)

remove_duplicate_columns(1)

groupby(1)

encode_target(1)

visualize_lineplot(1)

Ejemplo n.º 1

Mostrar archivo

    def test_cleancategorical_replacemissingnewcategory_noparams(self):

        missing_data = [[1.0, "Green", 2], [1.0, "Other", 1],
                        [np.nan, np.nan, np.nan]]

        columns = ["col1", "col2", "col3"]
        data = pd.DataFrame(missing_data, columns=columns)

        clean = Clean(x_train=data, test_split_percentage=0.5, split=False)
        clean.replace_missing_new_category()
        validate = clean.x_train.values.tolist()

        self.assertListEqual(
            validate, [[1, "Green", 2], [1, "Other", 1], [-1, "Unknown", -1]])

Ejemplo n.º 2

Mostrar archivo

    def test_cleancategorical_replacemissingnewcategory_dict(self):

        missing_data = [[1, "Green", 2], [1, np.nan, 1],
                        [np.nan, np.nan, np.nan]]

        columns = ["col1", "col2", "col3"]
        data = pd.DataFrame(missing_data, columns=columns)
        category_dict_mapping = {"col1": 2, "col2": "Blue", "col3": 4}

        clean = Clean(x_train=data, test_split_percentage=0.5, split=False)
        clean.replace_missing_new_category(col_mapping=category_dict_mapping)
        validate = clean.x_train.values.tolist()

        self.assertListEqual(
            validate,
            [[1.0, "Green", 2.0], [1.0, "Blue", 1.0], [2.0, "Blue", 4.0]])

Ejemplo n.º 3

Mostrar archivo

    def test_cleancategorical_replacemissingnewcategory_list_constantnotnone(
            self):

        missing_data = np.array([(1, "Green", 2), (1, "Other", 1),
                                 (None, None, None)])

        columns = ["col1", "col2", "col3"]
        data = pd.DataFrame(missing_data, columns=columns)
        list_col = ["col1", "col3"]

        clean = Clean(x_train=data, test_split_percentage=0.5, split=False)
        clean.replace_missing_new_category(list_of_cols=list_col,
                                           new_category=0)
        validate = clean.x_train.values.tolist()

        self.assertListEqual(
            validate,
            np.array([(1, "Green", 2), (1, "Other", 1),
                      (0, None, 0)]).tolist(),
        )

Ejemplo n.º 4

Mostrar archivo

    def test_cleancategorical_replacemissingnewcategory_list_constantisnone(
            self):

        missing_data = [[1.0, "Green", 2], [1.0, "Other", 1],
                        [np.nan, None, np.nan]]

        columns = ["col1", "col2", "col3"]
        data = pd.DataFrame(missing_data, columns=columns)
        list_col = ["col1", "col2"]

        clean = Clean(x_train=data, test_split_percentage=0.5, split=False)
        clean.replace_missing_new_category(list_of_cols=list_col)

        # Replacing NaNs with strings for validations as regular assert does == and to compare NaNs you need `is`
        clean._data_properties.x_train = clean.x_train.fillna("NaN was here")
        validate = clean.x_train.values.tolist()

        self.assertListEqual(
            validate,
            [[1, "Green", 2.0], [1, "Other", 1.0],
             [-1, "Unknown", "NaN was here"]],
        )

Ejemplo n.º 5

Mostrar archivo

    def test_report_cleaning_new_category(self):

        missing_data = [[1.0, "Green", 2], [1.0, "Other", 1],
                        [np.nan, np.nan, np.nan]]

        columns = ["col1", "col2", "col3"]
        data = pd.DataFrame(missing_data, columns=columns)

        clean = Clean(x_train=data,
                      test_split_percentage=0.5,
                      split=False,
                      report_name="test")
        clean_data = clean.replace_missing_new_category()

        with open(clean._data_properties.report.filename) as f:
            content = f.read()
        validate = "col1" in content and "col2" in content and "col3" in content

        os.remove(clean._data_properties.report.filename)

        self.assertTrue(validate)