Exemplos de DataOperations.partionData em Python

Linguagem de programação: Python

Classe / Tipo: DataOperations

Método / Função: partionData

Exemplos em hotexamples.com: 2

DataOperations.partionData em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de DataOperations.partionData em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

load_from_mongo(3)

getTitle(3)

save_to_mongo(3)

ensureMinSeriesLength(2)

partionData(2)

analyzingData(1)

append_arr_to_file(1)

append_to_file(1)

fitTrainingData(1)

pivot(1)

resample(1)

testClassifier(1)

unpivot(1)

Métodos Frequentes

load_from_mongo (3)

getTitle (3)

save_to_mongo (3)

ensureMinSeriesLength (2)

partionData (2)

analyzingData (1)

append_arr_to_file (1)

append_to_file (1)

fitTrainingData (1)

pivot (1)

Métodos Frequentes

resample (1)

testClassifier (1)

unpivot (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: PCA.py Projeto: sdmoran/CS4342_Project

def getPCATraingAndTesting(thresh): allData = loadData() trainingData, testingData = do.partionData(allData, .8) trainingX = trainingData.loc[:, features] trainingY = trainingData.loc[:,'label'] testingX = testingData.loc[:, features] testingY = testingData.loc[:, 'label'] #Standardize features #trainingX = StandardScaler().fit_transform(trainingX) pca = PCA() #Run PCA decomposition principalComponents = pca.fit_transform(trainingX) #Compute and print the number of components that PCA will extract numPcaComponents = findBestPCAFeatures(pca.explained_variance_ratio_, thresh) print(f'Components: {numPcaComponents}') principalDf = pd.DataFrame(principalComponents) trainingX = principalDf.iloc[:, 0:numPcaComponents+1] #Plot how each component affects the label #plotPcaComponentsAffectingY(principalDf, trainingY) testingX = pd.DataFrame(pca.transform(testingX)) testingX = testingX.iloc[:, 0:numPcaComponents+1] return trainingX, trainingY, testingX, testingY

Exemplo n.º 2

0

Exibir arquivo

def doBestFeatureSelection(clf, numFeatures): multDf = pd.read_csv(os.path.dirname(os.path.abspath(__file__))+'/data/TrainData_Labeled.csv') multTraining, multTesting = do.partionData(multDf, .8) bestFeatures = fs.getBestFeaturesForHigherOrderTerms(clf, multTraining, numFeatures, 'accuracy') #bestFeatures = list(['alcohol', 'volatile acidity*total sulfur dioxide*density*', 'volatile acidity*chlorides*free sulfur dioxide*pH*', 'fixed acidity*volatile acidity*free sulfur dioxide*pH*sulphates*']) print(bestFeatures) trainingData = multTraining.loc[:, bestFeatures] trainingY = multTraining['label'] trainingData.insert(loc = len(trainingData.columns),column='label', value=trainingY) testingData = multTesting.loc[:, bestFeatures] testingY = multTesting['label'] testingData.insert(loc = len(testingData.columns),column='label', value=testingY) print(testingData) do.fitTrainingData(clf, trainingData) do.testClassifier(clf, testingData, "Random Forests")