Ejemplos de DataManipulation.cleanTrainData en Python

Lenguaje de programación: Python

Clase / Tipo: DataManipulation

Método / Función: cleanTrainData

Ejemplos en hotexamples.com: 2

Python DataManipulation.cleanTrainData - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de DataManipulation.cleanTrainData extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

mapClasses(5)

cleanTestData(3)

cleanData(3)

saveResults(3)

cleanTrainData(2)

ExportScalingData(1)

ExportScalingDataNew(1)

PhoneLabeling(1)

PhoneLabelingNew(1)

add_x(1)

eq_scale(1)

interpolate(1)

normalize(1)

remove_x(1)

simpleFunctions(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: ProduceKaggle.py Proyecto: LucMioulet/MachineLearning

def main():
    trainData = pd.read_csv('CrimeClassification/Dataset/train-2.csv')
    classesMap = dm.mapClasses(trainData)
    print trainData.info()
    print(classesMap)
    cleanedTrainData,normalizationValues = dm.cleanTrainData(trainData,classesMap)
    print(cleanedTrainData.info())
    data = cleanedTrainData.values
    np.random.shuffle(data.astype(np.float64))
    Ytrain = binarizeLabels(data[0:,0])
    Xtrain = data[0:,1:]
    model = trainModel(Xtrain,Ytrain)
    output = testProbaModel(model,Xtrain)


    testData = pd.read_csv('CrimeClassification/Dataset/test-2.csv')
    cleanedTestData = dm.cleanTestData(testData,normalizationValues)
    print(cleanedTestData.info())
    output = testProbaModel(model,cleanedTestData.values[:,1:])

    result = np.c_[cleanedTestData.values[:,0].astype(int),output]
    outputVec = sorted(classesMap, key=classesMap.__getitem__)
    outputVec.insert(0,'Id')
    dataFrameResults = pd.DataFrame(result,columns=outputVec)
    dataFrameResults['Id']=dataFrameResults['Id'].astype(int)
    dm.saveResults(dataFrameResults)

Ejemplo n.º 2

Mostrar archivo

Archivo: ProtoML-keras.py Proyecto: LucMioulet/MachineLearning

def main():
    trainData = pd.read_csv('CrimeClassification/Dataset/train-2.csv')
    classesMap = dm.mapClasses(trainData)
    print trainData.info()
    print(classesMap)
    cleanedTrainData,normalizationValues = dm.cleanTrainData(trainData,classesMap)
    print(cleanedTrainData.info())
    [Xtrain, Ytrain, Xtest,Ytest]=splitData(cleanedTrainData.values)
    model = trainModel(Xtrain,Ytrain)
    Ypred = testModel(model,Xtest)
    confMatrix = da.confusionMatrix(Ypred,Ytest)
    titleCM = da.orderClassesMapKeys(classesMap)
    da.plotConfusionMatrix(confMatrix,titleCM)
    print (da.f1Score(Ypred,Ytest))