示例#1
0
from museotoolbox import datasets, processing

##############################################################################
# Load HistoricalMap dataset
# -------------------------------------------

raster, vector = datasets.load_historical_data(low_res=True)
field = 'Class'
y = processing.read_vector_values(vector, field)

##############################################################################
# Create CV
# -------------------------------------------

SKF = RandomStratifiedKFold(n_splits=2,
                            n_repeats=2,
                            random_state=12,
                            verbose=False)
for tr, vl in SKF.split(X=None, y=y):
    print(tr, vl)

###############################################################################
# .. note::
#    Split is made to generate each fold

# Show label

for tr, vl in SKF.split(X=None, y=y):
    print(y[tr], y[vl])

##############################################################################
# .. note::
示例#2
0
from museotoolbox.ai import SuperLearner
from museotoolbox.cross_validation import RandomStratifiedKFold
from museotoolbox.charts import PlotConfusionMatrix
from museotoolbox import datasets
from sklearn.ensemble import RandomForestClassifier

##############################################################################
# Load HistoricalMap dataset
# -------------------------------------------

X, y = datasets.load_historical_data(low_res=True, return_X_y=True)

##############################################################################
# Create CV
# -------------------------------------------
RSKF = RandomStratifiedKFold(n_splits=2, random_state=12, verbose=False)

##############################################################################
# Initialize Random-Forest
# ---------------------------

classifier = RandomForestClassifier()

##############################################################################
# Start learning
# ---------------------------

SL = SuperLearner(classifier=classifier,
                  param_grid=dict(n_estimators=[10, 100]))
SL.fit(X, y, cv=RSKF)