Python GalaxyData.split_training_and_validation_data Beispiele

Programmiersprache: Python

Namespace / Paketname: galaxy_data

Klasse / Typ: GalaxyData

Methode / Funktion: split_training_and_validation_data

Beispiele auf hotexamples.com: 2

Python GalaxyData.split_training_and_validation_data - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die galaxy_data.GalaxyData.split_training_and_validation_data, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

get_training_data(7)

get_test_data(3)

set_restricted_universe(2)

split_training_and_validation_data(2)

save_solution(1)

Beispiel #1

Datei anzeigen

Datei: run.py Projekt: jkcn90/kaggle_galaxy_zoo

def run(model, verbose=0):
    """Entry Point to run models

    Args:
        model: model function to run.
    """
    # Load the data and split into training and validation sets
    data = GalaxyData(feature_extraction.hog_features, scale_features=False)

    (training_features, training_solutions,
     validation_features, validation_solutions) = data.split_training_and_validation_data(50)

    # Train and Predict Model
    (clf, columns) = model(training_features, training_solutions, verbose)
    predicted_validation_solutions = models.predict(clf, validation_features, columns)

    # Evaluate Predictions
    valid_rmse = evaluate.get_errors_clf(clf, validation_features, validation_solutions)
    train_rmse = evaluate.get_errors_clf(clf, training_features, training_solutions)
    print " Validation RMSE: ", valid_rmse
    print " Training RMSE: ", train_rmse

Beispiel #2

Datei anzeigen

Datei: exploration.py Projekt: jkcn90/kaggle_galaxy_zoo

def extract_features(extraction_method, index=None, percent_subset=100, classification=False):
    """Runs the given extraction method on only those galaxys listed in index. Return a subset of
    those galaxies.

    Attrubutes:
        extraction_method: Extraction method to use. See feature_extraction
        index: Index of Galaxy for which to process data. If None, process all galaxies.
        percent_subset: Returns a subset of the data of this size (percent).

    Returns: A Tuple containing (X, y), with X being the features and y the labels.
    """
    data = GalaxyData(extraction_method, scale_features=False)
    if index is not None:
        data.set_restricted_universe(index)

    if percent_subset == 100:
        (X, y) = data.get_training_data(competition=True)
    else:
        (X, y, _, _) = data.split_training_and_validation_data(100-percent_subset, competition=True)

    y = get_reduced_solutions(y, classification=classification)
    return (X, y)