Python Selective.fit Examples, feature.selector.Selective.fit Python Examples

Example #1

0

Show file

 def test_variance_drop_all(self):
     data, label = get_data_label(load_boston())
     method = SelectionMethod.Variance(threshold=100000)
     selector = Selective(method)
     try:
         selector.fit(data)
         selector.transform(data)
     except ValueError:
         pass

Example #2

0

Show file

File: test_correlation.py Project: fidelity/selective

    def test_correlation(self):
        data, label = get_data_label(load_boston())

        method = SelectionMethod.Correlation(0.60)
        selector = Selective(method)
        selector.fit(data)
        subset = selector.transform(data)

        self.assertListEqual(list(subset.columns), ['CRIM', 'ZN', 'INDUS', 'CHAS', 'RM', 'PTRATIO', 'B'])

Example #3

0

Show file

File: test_correlation.py Project: fidelity/selective

    def test_correlation_small(self):
        data, label = get_data_label(load_boston())
        data = data.drop(columns=["CHAS", "NOX", "RM", "DIS", "RAD", "TAX", "PTRATIO", "INDUS"])

        method = SelectionMethod.Correlation(0.60)
        selector = Selective(method)
        selector.fit(data)
        subset = selector.transform(data)
        self.assertListEqual(list(subset.columns), ['CRIM', 'ZN', 'AGE', 'B'])

Example #4

0

Show file

File: test_tree.py Project: fidelity/selective

    def test_tree_invalid_num_features(self):
        data, label = get_data_label(load_boston())
        data = data.drop(columns=[
            "CHAS", "NOX", "RM", "DIS", "RAD", "TAX", "PTRATIO", "INDUS"
        ])

        method = SelectionMethod.TreeBased(num_features=100)
        selector = Selective(method)
        with self.assertRaises(ValueError):
            selector.fit(data, label)

Example #5

0

Show file

    def test_variance_zero_threshold(self):
        data, label = get_data_label(load_boston())

        method = SelectionMethod.Variance(threshold=0)
        selector = Selective(method)
        selector.fit(data)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(data.shape[1], 13)
        self.assertEqual(subset.shape[1], 13)

Example #6

0

Show file

File: test_stat_anova.py Project: fidelity/selective

    def test_anova_classif_top_percentile(self):
        data, label = get_data_label(load_iris())
        
        method = SelectionMethod.Statistical(num_features=0.5)
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 2)
        self.assertListEqual(list(subset.columns), ['petal length (cm)', 'petal width (cm)'])

Example #7

0

Show file

File: test_stat_chi.py Project: fidelity/selective

    def test_chi_regress_top_percentile_invalid(self):
        data, label = get_data_label(load_boston())
        data = data.drop(columns=[
            "CHAS", "NOX", "RM", "DIS", "RAD", "TAX", "PTRATIO", "INDUS"
        ])

        method = SelectionMethod.Statistical(num_features=0.6,
                                             method="chi_square")
        selector = Selective(method)
        with self.assertRaises(TypeError):
            selector.fit(data, label)

Example #8

0

Show file

File: test_tree.py Project: fidelity/selective

    def test_tree_estimator_lightgbm_classif_top_k(self):
        data, label = get_data_label(load_iris())

        method = SelectionMethod.TreeBased(
            num_features=2,
            estimator=XGBClassifier(random_state=Constants.default_seed))
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 2)

Example #9

0

Show file

    def test_variance_drop_target(self):
        data, label = get_data_label(load_boston())

        method = SelectionMethod.Variance(threshold=85)
        selector = Selective(method)
        selector.fit(data)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(data.shape[1], 13)
        self.assertEqual(subset.shape[1], 4)
        self.assertListEqual(list(subset.columns), ['ZN', 'AGE', 'TAX', 'B'])

Example #10

0

Show file

File: test_tree.py Project: fidelity/selective

    def test_tree_classif_top_k(self):
        data, label = get_data_label(load_iris())

        method = SelectionMethod.TreeBased(num_features=2)
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 2)
        self.assertListEqual(list(subset.columns),
                             ['petal length (cm)', 'petal width (cm)'])

Example #11

0

Show file

File: test_stat_anova.py Project: fidelity/selective

    def test_anova_regress_top_percentile_all(self):
        data, label = get_data_label(load_boston())
        data = data.drop(columns=["CHAS", "NOX", "RM", "DIS", "RAD", "TAX", "PTRATIO", "INDUS"])

        method = SelectionMethod.Statistical(num_features=1.0)
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(data.shape[1], subset.shape[1])
        self.assertListEqual(list(data.columns), list(subset.columns))

Example #12

0

Show file

File: test_stat_vif.py Project: fidelity/selective

    def test_vif_top_k_no_label(self):
        data, label = get_data_label(load_iris())

        method = SelectionMethod.Statistical(num_features=2,
                                             method="variance_inflation")
        selector = Selective(method)
        selector.fit(data)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 2)
        self.assertListEqual(list(subset.columns),
                             ['sepal width (cm)', 'petal width (cm)'])

Example #13

0

Show file

File: test_linear.py Project: fidelity/selective

    def test_linear_regress_top_k_all(self):
        data, label = get_data_label(load_boston())
        data = data.drop(columns=[
            "CHAS", "NOX", "RM", "DIS", "RAD", "TAX", "PTRATIO", "INDUS"
        ])

        method = SelectionMethod.Linear(num_features=5)
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertListEqual(list(data.columns), list(subset.columns))

Example #14

0

Show file

File: test_tree.py Project: fidelity/selective

    def test_tree_regress_top_percentile(self):
        data, label = get_data_label(load_boston())
        data = data.drop(columns=[
            "CHAS", "NOX", "RM", "DIS", "RAD", "TAX", "PTRATIO", "INDUS"
        ])

        method = SelectionMethod.TreeBased(num_features=0.6)
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 3)
        self.assertListEqual(list(subset.columns), ['CRIM', 'AGE', 'LSTAT'])

Example #15

0

Show file

File: test_tree.py Project: fidelity/selective

    def test_tree_estimator_adaboost_classif_top_k(self):
        data, label = get_data_label(load_iris())

        method = SelectionMethod.TreeBased(
            num_features=2,
            estimator=AdaBoostClassifier(random_state=Constants.default_seed))
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 2)
        self.assertListEqual(list(subset.columns),
                             ['petal length (cm)', 'petal width (cm)'])

Example #16

0

Show file

File: test_linear.py Project: fidelity/selective

    def test_linear_classif_top_percentile_all(self):
        data, label = get_data_label(load_iris())

        method = SelectionMethod.Linear(num_features=1.0)
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 4)
        self.assertListEqual(list(subset.columns), [
            'sepal length (cm)', 'sepal width (cm)', 'petal length (cm)',
            'petal width (cm)'
        ])

Example #17

0

Show file

File: test_linear.py Project: fidelity/selective

    def test_ridge_regress_top_k(self):
        data, label = get_data_label(load_boston())
        data = data.drop(columns=[
            "CHAS", "NOX", "RM", "DIS", "RAD", "TAX", "PTRATIO", "INDUS"
        ])

        method = SelectionMethod.Linear(num_features=3, regularization="ridge")
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 3)
        self.assertListEqual(list(subset.columns), ['CRIM', 'AGE', 'LSTAT'])

Example #18

0

Show file

File: test_tree.py Project: fidelity/selective

    def test_tree_estimator_xgboost_regress_top_k(self):
        data, label = get_data_label(load_boston())
        data = data.drop(columns=[
            "CHAS", "NOX", "RM", "DIS", "RAD", "TAX", "PTRATIO", "INDUS"
        ])

        method = SelectionMethod.TreeBased(
            num_features=3,
            estimator=XGBRegressor(random_state=Constants.default_seed))
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 3)

Example #19

0

Show file

File: test_stat_mutual.py Project: fidelity/selective

    def test_mutual_classif_top_k_all(self):
        data, label = get_data_label(load_iris())

        method = SelectionMethod.Statistical(num_features=4,
                                             method="mutual_info")
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 4)
        self.assertListEqual(list(subset.columns), [
            'sepal length (cm)', 'sepal width (cm)', 'petal length (cm)',
            'petal width (cm)'
        ])

Example #20

0

Show file

    def test_variance_lt1(self):
        data, label = get_data_label(load_boston())

        method = SelectionMethod.Variance(threshold=1.0)
        selector = Selective(method)
        selector.fit(data)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(data.shape[1], 13)
        self.assertEqual(subset.shape[1], 10)
        self.assertListEqual(list(subset.columns), [
            'CRIM', 'ZN', 'INDUS', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B',
            'LSTAT'
        ])

Example #21

0

Show file

File: test_stat_vif.py Project: fidelity/selective

    def test_vif_top_k_regression(self):
        data, label = get_data_label(load_boston())
        data = data.drop(columns=[
            "CHAS", "NOX", "RM", "DIS", "RAD", "TAX", "PTRATIO", "INDUS"
        ])

        method = SelectionMethod.Statistical(num_features=2,
                                             method="variance_inflation")
        selector = Selective(method)
        selector.fit(data, label)
        subset = selector.transform(data)

        # Reduced columns
        self.assertEqual(subset.shape[1], 2)
        self.assertListEqual(list(subset.columns), ['CRIM', 'ZN'])