Python DataManipulation.cleanTrainData Beispiele

Programmiersprache: Python

Klasse / Typ: DataManipulation

Methode / Funktion: cleanTrainData

Beispiele auf hotexamples.com: 2

Python DataManipulation.cleanTrainData - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die DataManipulation.cleanTrainData, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

mapClasses(5)

cleanTestData(3)

cleanData(3)

saveResults(3)

cleanTrainData(2)

ExportScalingData(1)

ExportScalingDataNew(1)

PhoneLabeling(1)

PhoneLabelingNew(1)

add_x(1)

eq_scale(1)

interpolate(1)

normalize(1)

remove_x(1)

simpleFunctions(1)

Beispiel #1

Datei anzeigen

Datei: ProduceKaggle.py Projekt: LucMioulet/MachineLearning

def main():
    trainData = pd.read_csv('CrimeClassification/Dataset/train-2.csv')
    classesMap = dm.mapClasses(trainData)
    print trainData.info()
    print(classesMap)
    cleanedTrainData,normalizationValues = dm.cleanTrainData(trainData,classesMap)
    print(cleanedTrainData.info())
    data = cleanedTrainData.values
    np.random.shuffle(data.astype(np.float64))
    Ytrain = binarizeLabels(data[0:,0])
    Xtrain = data[0:,1:]
    model = trainModel(Xtrain,Ytrain)
    output = testProbaModel(model,Xtrain)


    testData = pd.read_csv('CrimeClassification/Dataset/test-2.csv')
    cleanedTestData = dm.cleanTestData(testData,normalizationValues)
    print(cleanedTestData.info())
    output = testProbaModel(model,cleanedTestData.values[:,1:])

    result = np.c_[cleanedTestData.values[:,0].astype(int),output]
    outputVec = sorted(classesMap, key=classesMap.__getitem__)
    outputVec.insert(0,'Id')
    dataFrameResults = pd.DataFrame(result,columns=outputVec)
    dataFrameResults['Id']=dataFrameResults['Id'].astype(int)
    dm.saveResults(dataFrameResults)

Beispiel #2

Datei anzeigen

Datei: ProtoML-keras.py Projekt: LucMioulet/MachineLearning

def main():
    trainData = pd.read_csv('CrimeClassification/Dataset/train-2.csv')
    classesMap = dm.mapClasses(trainData)
    print trainData.info()
    print(classesMap)
    cleanedTrainData,normalizationValues = dm.cleanTrainData(trainData,classesMap)
    print(cleanedTrainData.info())
    [Xtrain, Ytrain, Xtest,Ytest]=splitData(cleanedTrainData.values)
    model = trainModel(Xtrain,Ytrain)
    Ypred = testModel(model,Xtest)
    confMatrix = da.confusionMatrix(Ypred,Ytest)
    titleCM = da.orderClassesMapKeys(classesMap)
    da.plotConfusionMatrix(confMatrix,titleCM)
    print (da.f1Score(Ypred,Ytest))