Python StandardScaler.fit_transform示例

编程语言: Python

命名空间/包名称: pyspark.ml.feature

类/类型: StandardScaler

方法/功能: fit_transform

hotexamples.com的示例: 1

Python StandardScaler.fit_transform - 已找到1个示例。这些是从开源项目中提取的最受好评的pyspark.ml.feature.StandardScaler.fit_transform现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

StandardScaler(30)

fit(30)

getOutputCol(9)

transform(8)

drop(2)

setInputCol(2)

fit_transform(1)

getMax(1)

getMin(1)

load(1)

setOutputCol(1)

setWithMean(1)

setWithStd(1)

write(1)

示例#1

显示文件

df=spark.read.csv('hdfs://localhost:9000/user/BigDataProj/diab.csv',inferSchema=True,header=True)

from pyspark.sql.functions import col
from sklearn.linear_model import LogisticRegression
new_data = df.select(*(col(c).cast("float").alias(c) for c in df.columns))

from pyspark.sql.functions import col,count,isnan,when
from sklearn.preprocessing import StandardScaler
new_data.select([count(when(col(c).isNull(),c)).alias(c) for c in new_data.columns]).show()

cols=new_data.columns
cols.remove("Outcome")
assembler = VectorAssembler(inputCols=cols,outputCol="features")

data=assembler.transform(new_data)
# data.select("features",'Outcome').show(truncate=False)


train, tesT = df.randomSplit([0.7, 0.3])
x_col = new_data.columns
x_train = train.toPandas()[x_col[:-1]].values
y_train = train.toPandas()['Outcome'].values
sc = StandardScaler()
x_train = sc.fit_transform(x_train)
cls = LogisticRegression()
cls.fit(x_train,y_train)

save_path = 'prediction/'
completeName = os.path.join(save_path, "dblogR.pkl")         
pickle.dump(cls, open(completeName, 'wb'))