Python StandardScaler.setWithStd示例

编程语言: Python

命名空间/包名称: pyspark.ml.feature

类/类型: StandardScaler

方法/功能: setWithStd

hotexamples.com的示例: 1

Python StandardScaler.setWithStd - 已找到1个示例。这些是从开源项目中提取的最受好评的pyspark.ml.feature.StandardScaler.setWithStd现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

StandardScaler(30)

fit(30)

getOutputCol(9)

transform(8)

drop(2)

setInputCol(2)

fit_transform(1)

getMax(1)

getMin(1)

load(1)

setOutputCol(1)

setWithMean(1)

setWithStd(1)

write(1)

示例#1

显示文件

    def train(self, df):
        df = self.build_features_vectors(df)

        scaler = StandardScaler()
        scaler.setInputCol(self.features_values_column)
        scaler.setOutputCol(self.features_values_scaled)
        scaler.setWithMean(self.scaler_with_mean)
        scaler.setWithStd(self.scaler_with_std)
        self.scaler_model = scaler.fit(df)
        df = self.scaler_model.transform(df).persist(
            StorageLevelFactory.get_storage_level(self.storage_level))
        if len(self.categorical_features):
            self._create_indexes(df)
            self._add_categorical_features(df, self.features_values_scaled)

        iforest = IForest(
            featuresCol=self.features_values_scaled,
            predictionCol=self.prediction_column,
            # anomalyScore=self.score_column,
            numTrees=self.num_trees,
            maxSamples=self.max_samples,
            maxFeatures=self.max_features,
            maxDepth=self.max_depth,
            contamination=self.contamination,
            bootstrap=self.bootstrap,
            approxQuantileRelativeError=self.
            approximate_quantile_relative_error,
            # numCategoricalFeatures=len(self.categorical_features)
        )
        iforest.setSeed(self.seed)
        params = {'threshold': self.threshold}
        self.iforest_model = iforest.fit(df, params)
        df.unpersist()