Python TargetEncoder.transform Examples

Programming Language: Python

Namespace/Package Name: cobra.preprocessing.target_encoder

Class/Type: TargetEncoder

Method/Function: transform

Examples at hotexamples.com: 5

Python TargetEncoder.transform - 5 examples found. These are the top rated real world Python examples of cobra.preprocessing.target_encoder.TargetEncoder.transform extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

TargetEncoder(18)

fit(6)

_global_mean(5)

transform(5)

_fit_column(4)

_clean_column_name(2)

set_attributes_from_dict(2)

attributes_to_dict(1)

Example #1

Show file

    def test_target_encoder_transform_when_not_fitted(self):
        df = pd.DataFrame({
            'variable': [
                'positive', 'positive', 'negative', 'neutral', 'negative',
                'positive', 'negative', 'neutral', 'neutral', 'neutral'
            ],
            'target': [1, 1, 0, 0, 1, 0, 0, 0, 1, 1]
        })

        # inputs of TargetEncoder will be of dtype category
        df["variable"] = df["variable"].astype("category")

        encoder = TargetEncoder()
        with pytest.raises(NotFittedError):
            encoder.transform(data=df, column_names=["variable"])

Example #2

Show file

File: test_target_encoder.py Project: jhanishant260/cobra

    def test_target_encoder_transform_new_category(self):

        df = pd.DataFrame({
            'variable': [
                'positive', 'positive', 'negative', 'neutral', 'negative',
                'positive', 'negative', 'neutral', 'neutral', 'neutral'
            ],
            'target': [1, 1, 0, 0, 1, 0, 0, 0, 1, 1]
        })

        df_appended = df.append({
            "variable": "new",
            "target": 1
        },
                                ignore_index=True)

        # inputs of TargetEncoder will be of dtype category
        df["variable"] = df["variable"].astype("category")
        df_appended["variable"] = df_appended["variable"].astype("category")

        expected = df_appended.copy()
        expected["variable_enc"] = [
            0.666667, 0.666667, 0.333333, 0.50000, 0.333333, 0.666667,
            0.333333, 0.50000, 0.50000, 0.50000, 0.333333
        ]

        encoder = TargetEncoder(imputation_strategy="min")
        encoder.fit(data=df, column_names=["variable"], target_column="target")
        actual = encoder.transform(data=df_appended, column_names=["variable"])

        pd.testing.assert_frame_equal(actual, expected)

Example #3

Show file

    def test_target_encoder_transform_new_category_linear_regression(self):
        df = pd.DataFrame({
            'variable': [
                'positive', 'positive', 'negative', 'neutral', 'negative',
                'positive', 'negative', 'neutral', 'neutral', 'neutral',
                'positive'
            ],
            'target': [5, 4, -5, 0, -4, 5, -5, 0, 1, 0, 4]
        })

        df_appended = df.append({
            "variable": "new",
            "target": 10
        },
                                ignore_index=True)

        # inputs of TargetEncoder will be of dtype category
        df["variable"] = df["variable"].astype("category")
        df_appended["variable"] = df_appended["variable"].astype("category")

        expected = df_appended.copy()
        expected["variable_enc"] = [
            4.500000, 4.500000, -4.666667, 0.250000, -4.666667, 4.500000,
            -4.666667, 0.250000, 0.250000, 0.250000, 4.500000, -4.666667
        ]  # min imputation for new value

        encoder = TargetEncoder(imputation_strategy="min")
        encoder.fit(data=df, column_names=["variable"], target_column="target")
        actual = encoder.transform(data=df_appended, column_names=["variable"])

        pd.testing.assert_frame_equal(actual, expected)

Example #4

Show file

    def test_target_encoder_transform_binary_classification(self):
        df = pd.DataFrame({
            'variable': [
                'positive', 'positive', 'negative', 'neutral', 'negative',
                'positive', 'negative', 'neutral', 'neutral', 'neutral'
            ],
            'target': [1, 1, 0, 0, 1, 0, 0, 0, 1, 1]
        })

        # inputs of TargetEncoder will be of dtype category
        df["variable"] = df["variable"].astype("category")

        expected = df.copy()
        expected["variable_enc"] = [
            0.666667, 0.666667, 0.333333, 0.50000, 0.333333, 0.666667,
            0.333333, 0.50000, 0.50000, 0.50000
        ]

        encoder = TargetEncoder()
        encoder.fit(data=df, column_names=["variable"], target_column="target")
        actual = encoder.transform(data=df, column_names=["variable"])

        pd.testing.assert_frame_equal(actual, expected)

Example #5

Show file

    def test_target_encoder_transform_linear_regression(self):
        df = pd.DataFrame({
            'variable': [
                'positive', 'positive', 'negative', 'neutral', 'negative',
                'positive', 'negative', 'neutral', 'neutral', 'neutral',
                'positive'
            ],
            'target': [5, 4, -5, 0, -4, 5, -5, 0, 1, 0, 4]
        })

        # inputs of TargetEncoder will be of dtype category
        df["variable"] = df["variable"].astype("category")

        expected = df.copy()
        expected["variable_enc"] = [
            4.500000, 4.500000, -4.666667, 0.250000, -4.666667, 4.500000,
            -4.666667, 0.250000, 0.250000, 0.250000, 4.500000
        ]

        encoder = TargetEncoder()
        encoder.fit(data=df, column_names=["variable"], target_column="target")
        actual = encoder.transform(data=df, column_names=["variable"])

        pd.testing.assert_frame_equal(actual, expected)