Python RandomForestRegressor.transformの例

プログラミング言語: Python

名前空間/パッケージ名: pyspark.ml.regression

メソッド/関数: transform

hotexamples.comのコード掲載数: 4

Python RandomForestRegressor.transform - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのpyspark.ml.regression.RandomForestRegressor.transformの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

RandomForestRegressor(30)

fit(30)

transform(4)

getMaxDepth(4)

getNumTrees(4)

save(2)

setPredictionCol(2)

setLabelCol(2)

predict(2)

load(2)

explainParams(1)

get_params(1)

getPredictionCol(1)

setMaxDepth(1)

setNumTrees(1)

setParams(1)

getMaxBins(1)

set_params(1)

getLabelCol(1)

write(1)

コード例 #1

ファイルを表示

model = RandomForestRegressor(numTrees=100)
model = model.fit(train_data)

# # model evaluation

# In[ ]:

model.featureImportances

# In[ ]:

from pyspark.ml.evaluation import RegressionEvaluator

# In[ ]:

test_results = model.transform(test_data)

# In[ ]:

evaluator = RegressionEvaluator()
print('RMSE')
evaluator.evaluate(test_results)

# In[ ]:

print('R_sqr')
evaluator.evaluate(test_results, {evaluator.metricName: "r2"})

# In[ ]:

print('MAE')

コード例 #2

ファイルを表示

#Definimos el algoritmo del modelo (random forest)
model_regresion = RandomForestRegressor(labelCol="label",
                                        featuresCol="features",
                                        maxDepth=11,
                                        maxBins=64,
                                        numTrees=10)

# Fit the model
model_regresion = model_regresion.fit(train_LP)

#Save the model
# model_multiclase.save("dbfs:/dataset/modelo_multiclase_RF")

# Make predictions.
predictions = model_regresion.transform(evaluation_LP)

evaluator = RegressionEvaluator(labelCol="label",
                                predictionCol="prediction",
                                metricName="rmse")
rmse = evaluator.evaluate(predictions)
print("Root Mean Squared Error (RMSE) on test data = %g" % rmse)

# COMMAND ----------

#Generamos un vector con la columna array features

ignore = ["label"]
assembler = VectorAssembler(
    inputCols=[x for x in test.columns if x not in ignore],
    outputCol='features')

コード例 #3

ファイルを表示

df_testing = df_testing.dropna()

#assembler
assembler = VectorAssembler(inputCols=['Latitude', 'Longitude', 'Depth'],
                            outputCol='features')

model = RandomForestRegressor(featuresCol='features', labelCol='Magnitude')

#pipeline
pipeline = Pipeline(stages=[assembler, model])

#train_model
model = pipeline.fit(df_training)

#make prediction
pred = model.transform(df_testing)

#evaluate
evaluator = RegressionEvaluator(labelCol='Magnitude',
                                predictionCol='prediction',
                                metricName='rmse')
rmse = evaluator.evaluate(pred)

#create the prediction dataset
df_pred_results = pred['Latitude', 'Longitude', 'prediction']

#rename prediction column
df_pred_results = df_pred_results.withColumnRenamed('prediction',
                                                    'Pred_Magnitude')

#add more column to df_pred_results

コード例 #4

ファイルを表示

from pyspark.ml.regression import LinearRegression
lin_reg = LinearRegression(labelCol='total')
lr_model = lin_reg.fit(df_train)
print(lr_model.coefficients, '\n', lr_model.intercept)
train_prediction = lr_model.evaluate(df_train)
print(train_prediction.r2, train_prediction.meanAbsoluteError)

test_prediction = lr_model.evaluate(df_test)
print(test_prediction.r2, test_prediction.meanAbsoluteError)

test_prediction.predictions.show(3)

from pyspark.ml.regression import RandomForestRegressor
rf_model = RandomForestRegressor(featuresCol='features', 
                                 labelCol='total', numTrees=100).fit(df_train)
predictions = rf_model.transform(df_test)
predictions.show()
rf_model.featureImportances

from pyspark.mllib.evaluation import RegressionMetrics
from pyspark.ml.evaluation import RegressionEvaluator
# Select (prediction, true label) and compute test error
evaluator = RegressionEvaluator(
    labelCol="total", predictionCol="prediction", metricName="rmse")
rmse = evaluator.evaluate(predictions)
print("Root Mean Squared Error (RMSE) on test data = %g" % rmse)

rf_model.stages[1]
print(rf_model)  # summary only