Ejemplos de StringIndexer.fillna en Python

Lenguaje de programación: Python

Namespace/Package Name: pyspark.ml.feature

Clase / Tipo: StringIndexer

Método / Función: fillna

Ejemplos en hotexamples.com: 1

Python StringIndexer.fillna - 1 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de pyspark.ml.feature.StringIndexer.fillna extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

StringIndexer(30)

fit(30)

transform(30)

getOutputCol(22)

show(19)

select(15)

setHandleInvalid(14)

write(10)

drop(9)

randomSplit(8)

toPandas(4)

withColumnRenamed(4)

getInputCol(3)

withColumn(3)

groupBy(3)

where(3)

printSchema(3)

save(2)

setInputCol(2)

count(2)

take(1)

describe(1)

setOutputCol(1)

filter(1)

dropna(1)

fitAsync(1)

orderBy(1)

_call_java(1)

labels(1)

groupby(1)

getOutputCols(1)

fillna(1)

load(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: main.py Proyecto: jwzcheng/survey

data = spark.read.csv('./data/train_sample100w.csv', header=True)

print('==PREPROCESSING== \n')
# Input the selected features
col = pd.read_csv('/Users/jaycheng/Dropbox/python/ms_comp/feature1.csv',
                  index_col=0)
col = col.iloc[:, 0].tolist()
col.append('MachineIdentifier')
col.append('HasDetections')
data = data.select(col)

# drop samples with missing value
# data = data.dropna('any')

# fill missing value -1
data = data.fillna('-1')

print('==StringIndexer== \n')
ignore = ['MachineIdentifier', 'HasDetections']
# StringIndexer all features.
stringindexer = [
    StringIndexer(inputCol=i, outputCol=i + "_index") for i in data.columns
    if i not in ignore
]
pipeline = Pipeline(stages=stringindexer)
data = pipeline.fit(data).transform(data)

# Fit on whole dataset to include all labels in index.
labelindex = StringIndexer(inputCol="HasDetections", outputCol="indexedLabel")
data = labelindex.fit(data).transform(data)