Ejemplos de SMOTE.groupby en Python

Lenguaje de programación: Python

Namespace/Package Name: imblearn.over_sampling

Clase / Tipo: SMOTE

Método / Función: groupby

Ejemplos en hotexamples.com: 1

Python SMOTE.groupby - 1 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de imblearn.over_sampling.SMOTE.groupby extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

SMOTE(30)

fit_sample(30)

fit_resample(30)

fit(22)

reshape(9)

sample(6)

drop(5)

to_csv(2)

get_params(2)

head(2)

k_neighbors(2)

to(1)

select_dtypes(1)

min(1)

reset_index(1)

requires_grad_(1)

predict(1)

over_sample(1)

iterrows(1)

merge(1)

max(1)

join(1)

_fit_resample(1)

groupby(1)

fit_transform(1)

drop_duplicates(1)

corr(1)

astype(1)

assign(1)

_make_samples(1)

tolist(1)

Ejemplo n.º 1

Mostrar archivo

        # Cast score attribute as binary 'pass' (0) / 'fail' (1)
        y_train = train['score'].apply(lambda x: 0 if x >= 40 else 1)
        y_test = test['score'].apply(lambda x: 0 if x >= 40 else 1)

        columns = list(X_train)

        # Apply SMOTE to the training data
        X_train, y_train = SMOTE(random_state=0).fit_resample(X_train, y_train)
        X_train = pd.DataFrame(data=X_train, columns=columns)
        y_train = pd.Series(y_train)

        # Handle duplicate rows by reducing to majority class
        if len(X_train) != len(X_train.drop_duplicates()):

            # Group training data by matching all attributes (duplicates)
            train_groups = X_train.groupby(by=list(X_train))

            # Drop duplicate rows in the training data
            X_train = X_train.drop_duplicates().copy(deep=True)

            mode_labels = {}

            # Loop through each unique (non-duplicate) row
            for unique_row in train_groups.groups.keys():

                # Retrieve all labels for a given row and its duplicates
                group_labels = y_train.loc[train_groups.groups[unique_row]]

                # Record the majority class for each unique row
                mode_labels[unique_row] = group_labels.value_counts().idxmax()