Esempi in Python per SMOTE.groupby

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: imblearn.over_sampling

Classe/tipologia: SMOTE

Metodo/funzione: groupby

Esempi su hotexamples.com: 1

SMOTE.groupby in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per imblearn.over_sampling.SMOTE.groupby, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

SMOTE(30)

fit_sample(30)

fit_resample(30)

fit(22)

reshape(9)

sample(6)

drop(5)

to_csv(2)

get_params(2)

head(2)

k_neighbors(2)

to(1)

select_dtypes(1)

min(1)

reset_index(1)

requires_grad_(1)

predict(1)

over_sample(1)

iterrows(1)

merge(1)

max(1)

join(1)

_fit_resample(1)

groupby(1)

fit_transform(1)

drop_duplicates(1)

corr(1)

astype(1)

assign(1)

_make_samples(1)

tolist(1)

Esempio n. 1

Mostra file

        # Cast score attribute as binary 'pass' (0) / 'fail' (1)
        y_train = train['score'].apply(lambda x: 0 if x >= 40 else 1)
        y_test = test['score'].apply(lambda x: 0 if x >= 40 else 1)

        columns = list(X_train)

        # Apply SMOTE to the training data
        X_train, y_train = SMOTE(random_state=0).fit_resample(X_train, y_train)
        X_train = pd.DataFrame(data=X_train, columns=columns)
        y_train = pd.Series(y_train)

        # Handle duplicate rows by reducing to majority class
        if len(X_train) != len(X_train.drop_duplicates()):

            # Group training data by matching all attributes (duplicates)
            train_groups = X_train.groupby(by=list(X_train))

            # Drop duplicate rows in the training data
            X_train = X_train.drop_duplicates().copy(deep=True)

            mode_labels = {}

            # Loop through each unique (non-duplicate) row
            for unique_row in train_groups.groups.keys():

                # Retrieve all labels for a given row and its duplicates
                group_labels = y_train.loc[train_groups.groups[unique_row]]

                # Record the majority class for each unique row
                mode_labels[unique_row] = group_labels.value_counts().idxmax()