Esempi in Python per SMOTE.select_dtypes

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: imblearn.over_sampling

Classe/tipologia: SMOTE

Metodo/funzione: select_dtypes

Esempi su hotexamples.com: 1

SMOTE.select_dtypes in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per imblearn.over_sampling.SMOTE.select_dtypes, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

SMOTE(30)

fit_sample(30)

fit_resample(30)

fit(22)

reshape(9)

sample(6)

drop(5)

to_csv(2)

get_params(2)

head(2)

k_neighbors(2)

to(1)

select_dtypes(1)

min(1)

reset_index(1)

requires_grad_(1)

predict(1)

over_sample(1)

iterrows(1)

merge(1)

max(1)

join(1)

_fit_resample(1)

groupby(1)

fit_transform(1)

drop_duplicates(1)

corr(1)

astype(1)

assign(1)

_make_samples(1)

tolist(1)

Esempio n. 1

Mostra file

File: generic-classifier sp.py Progetto: yampritelpa/music-projects

from sklearn.model_selection import train_test_split, cross_validate
from sklearn.pipeline import Pipeline
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.ensemble import GradientBoostingClassifier

x, y, sum_labels = load_data('red-velvet-features.csv',
                             'rv-comparison-features.csv')
x_train, x_val, y_train, y_val = train_test_split(x, y)
x_smote, y_smote = SMOTE().fit_resample(x_train, y_train)
x_smote = pd.DataFrame(x_smote, columns=x_train.columns)

num_processor = Pipeline([('scaler', StandardScaler())])
cat_processor = Pipeline([('ohe', OneHotEncoder())])
processor = ColumnTransformer([
    ('num', num_processor, x_smote.select_dtypes('float64').columns),
    ('cat', cat_processor, x_smote.select_dtypes('object').columns)
])
model = Pipeline([('processor', processor),
                  ('classifier',
                   GradientBoostingClassifier(learning_rate=0.1,
                                              n_estimators=1000))])

model.fit(x_smote, y_smote)

#%%
from sklearn.metrics import classification_report, roc_auc_score

guesses = model.predict_proba(x_val)[:, 1]
answers = sum_labels.iloc[y_val.index][[
    'artist name', 'rating', 'song title', 'release date'