Python DataManager.dropUnnecessaryColumns Beispiele

Programmiersprache: Python

Namespace / Paketname: Data

Klasse / Typ: DataManager

Methode / Funktion: dropUnnecessaryColumns

Beispiele auf hotexamples.com: 1

Python DataManager.dropUnnecessaryColumns - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die Data.DataManager.dropUnnecessaryColumns, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

getSetSize(5)

DataManager(4)

getImage(3)

getImgSize(3)

applyEncodingToNonNumericData(1)

checkSkew(1)

dropUnnecessaryColumns(1)

get(1)

getDataName(1)

new(1)

readData(1)

removeOutlier(1)

scaleData(1)

showCorr(1)

update(1)

Beispiel #1

Datei anzeigen

                                    hist=True,
                                    boxSize=size,
                                    fileName='01_INITIAL')
# %%
# Display Boxplot.To check on outliers on numrical data which has been scaled. File output is at \output\02_OUTLIER_BoxPlot.png
analyser.histogramOrBoxPlotAnalysis(dfFullData,
                                    strCols=True,
                                    hist=False,
                                    boxSize=size,
                                    fileName='02_OUTLIER')
# %%
# 3. Data Pre Process
# 3.1 Remove unnecessary features
# Drop cells which is not useful in classification
dropColslist = ['id', 'Unnamed: 32']
df_drop_idUnamed = dataManager.dropUnnecessaryColumns(dfFullData, dropColslist)
df_drop_idUnamed.info()
# %%
# 3.2 Check duplicated records
# Check for duplicates. There are no duplicates
duplicateRowsDF = df_drop_idUnamed[df_drop_idUnamed.duplicated()]
duplicateRowsDF

#%%
# 3.3 Check for skewed data and try to normalize records
# Check for skewed data in numerical data and process skewed data to normalize it
dfskew = dataManager.checkSkew(df_drop_idUnamed)
dfskew.to_excel(output + "DF_Skew.xlsx")
dfskew
# Display Histogram.To check general data distibution on numrical data after unskew. File output is at \output\04_SKEW_DistPlot.png
analyser.histogramOrBoxPlotAnalysis(dfskew,