Python VarianceThreshold.columns示例

编程语言: Python

命名空间/包名称: sklearn.feature_selection

方法/功能: columns

hotexamples.com的示例: 3

Python VarianceThreshold.columns - 已找到3个示例。这些是从开源项目中提取的最受好评的sklearn.feature_selection.VarianceThreshold.columns现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

VarianceThreshold(30)

fit(30)

fit_transform(30)

get_support(30)

transform(30)

inverse_transform(14)

columns(3)

get_params(3)

set_params(3)

_get_support_mask(1)

fit_trandform(1)

name(1)

params(1)

predict(1)

toarray(1)

示例#1

显示文件

文件： customer_satisfaction.py 项目： cpumar/data-science-training

def VarianceThreshold_selector(data, th):
    #Select Model
    selector = VarianceThreshold(
        th
    )  #Defaults to 0.0, e.g. only remove features with the same value in all samples
    #Fit the Model
    selector.fit(data)
    features = selector.get_support(
        indices=True
    )  #returns an array of integers corresponding to nonremoved features
    features = [column for column in data[features]
                ]  #Array of all nonremoved features' names
    #Format and Return
    selector = pd.DataFrame(selector.transform(data))
    selector.columns = features
    return selector

示例#2

显示文件

        def VarianceThreshold_selector(data):

            #Select Model
            selector = VarianceThreshold(threshold=(.8 * (1 - .8)))

            #Fit the Model
            selector.fit(data)
            features = selector.get_support(indices = True) #returns an array of integers corresponding to nonremoved features
            #print (features)
            Features = list(data)
            features = [Features[i] for i in features]
            #features = [column for column in data[features]] #Array of all nonremoved features' names
            #print (features)
            #Format and Return
            selector = pd.DataFrame(selector.transform(data))
            selector.columns = features
            return selector

示例#3

显示文件

    def variance_threshold(self: pd.DataFrame, cp, fecha, threshold=0.0):
        """        
        VarianceThreshold is a simple baseline approach to feature selection. It removes all features whose variance
        doesn’t meet some threshold. By default, it removes all zero-variance features, i.e.
        features that have the same value in all samples.
        As an example, suppose that we have a dataset with boolean features,
        and we want to remove all features that are either one or zero (on or off) in more than 80% of the samples.
        """
        column_names = self.columns.values.tolist()
        key_variables = ['id_siniestro', 'id_poliza', 'cod_filiacion'] + cp + fecha
        removed_var = []
        for i in key_variables:
            try:
                column_names.remove(i)
                removed_var.append(i)
            except:
                pass

        append_names = []
        for i in column_names:
            self_i = self[[i]]
            self_i = self_i.apply(pd.to_numeric, errors='coerce')
            self_i = self_i.dropna(how='any', axis=0)
            selection = VarianceThreshold(threshold=threshold)
            try:
                selection.fit(self_i)
                features = selection.get_support(indices=True)
                features = self_i.columns[features]
                features = [column for column in self_i[features]]
                selection = pd.DataFrame(selection.transform(self_i), index=self_i.index)
                selection.columns = features
                append_names.append(selection.columns.values.tolist())
            except:
                pass

        append_names = [item for sublist in append_names for item in sublist]
        append_names = list(set(append_names))
        self = self[removed_var + append_names]
        return self